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Bevezetés 


Amiről beszélni fogok, az sem bonyolult, sem 
perlekedő nem lesz. JOHN L. AUSTIN 


Ez a könyv algoritmusokról szól. Az algoritmus fogalmáról — azt gondoljuk - már 
minden olvasónknak van valamilyen képe, Pontos meghatározásra nem szeretnénk 
vállalkozni, elsősorban azért nem, mert a szó a szakmán belül is több különböző 
értelemben használatos. E változatok közös magjának érzékeltetésére olyan szi- 
nonimákat említhetünk, mint eljárás, recept, módszer, Jól meghatározott lépések 
egymásutánja, amelyek már elég pontosan, egyértelműen megfogalmazottak ah- 
hoz, hogy gépiesen végrehajthatók legyenek. 

Az , algoritmus" szó eredetéért a IX. századba és az Arab Kalifátus csillogó 
fővárosába, Bagdadba kell visszatekíntenünk. Itt dolgozott az Al Khvarizmi (Kho- 
rezmből való) néven ismert Mohamed ibn Músza, aki több nevezetes tudományos 
könyvet írt. Ezek egyike (a latin fordításban fennmaradt De Numero Indorum) a 
decimális számokkal való hindu eredetű számolási eljárásokat írja le. Lényegében 
azokat, amelyeket az elemi iskolában tanultunk az egészekkel való alapműveletek 
elvégzésére, Elsősorban világos stílusának és a pontos, részletes indoktásoknak 
köszönhetően AI Khvarizmi könyvét évszázadokig forgatták a középkori Európá- 
ban. Az algoritmus szó a szerző nevének a latin fordítások által eltorzított válto- 
zata. Sokáig ezeket az indiai eredetű számolási szabályokat értették alatta. 

A számítógépes algoritmus fogalma szorosan kapcsolódik a program fogal- 
mához. Az egyik lehetséges megközelítés, amivel később részletesebben is megis- 
merkedünk, lényegében azonosítja a kettőt. Az algoritmusok elmélete, ahogy ma 
állnak a dolgok, jóval kevesebbet vállal fel, mint amennyit az előbbi ambiciózus 
meghatározás sugall. Ez a terület főként a kisebb, építőkő jellegű problémákkal 
foglalkozik. Nemigen szokás algoritmusnak nevezni egy több tízezer utasításból 
álló adatbáziskezelő programot vagy annak logikai vázát. 

Az algorítmika konstruktív iránya elsősorban akkora feladatokkal foglalkozik, 
melyek megoldása legfeljebb néhány száz C-sorban kódolható. A megoldást je- 
lentő módszerek tervezésének nélkülözhetetlen része a módszerek elemzése. Az 
elemzés során arra keresünk választ, hogy algoritmusaink mennyire hatékonyak. 
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Az összetett, igazán nagyméretű feladatokkal a szoftvertechnológia (a szoká- 
sos angol szakkifejezésekkel software engineering, illetve software technology) 
foglalkozik. A problémák méretének növekedtével egészen más kérdések kerülnek 
előtérbe. Ilyenek például a tervezendő rendszer áttekinthetősége, felbonthatósága 
emberszabású részekre, az így kapott darabok összeillesztése, tesztelése, stb. Mi 
itt nem foglalkozunk ezekkel a kérdésekkel. 

Algoritmusokkal és adatszerkezetekkel kapcsolatos ismeretekre, készségekre 
szüksége van mindenkinek, aki komolyan foglalkozik programozással és progra- 
mok tervezésével. Ennek megfelelően kialakult egy eléggé letisztult törzsanyag, 
amit világszerte oktatnak a számítástechnikai, informatikai képzést nyújtó egye- 
temi szakokon. Elsődleges célunk volt ennek az anyagnak a feldolgozása. 

A bevezető jellegű első fejezetben egyszerű példákon keresztül igyekeztünk 
érzékeltetni az algoritmusok tervezésének és elemzésének folyamatát. Ezek játé- 
kos, könnyen áttekinthető példák, amelyek segítségével az olvasó megismerkedhet 
a terület szemléletének, stílusának alapjaival. Ennek a résznek a fő célja az anyag 
befogadásához szükséges beállítottság kialakítása. 

A 2-5. és részben a 6. fejezetben a ma már klasszikusnak számító alapvető 
adatszerkezetekkel és algoritmusaikkal foglalkozunk. A központi témák itt a ren- 
dezés és a keresés. A legérdekesebb rendező algoritmusok tárgyalása után a fa- 
jellegű, majd pedig a hash-elésen alapuló tárolási/keresési technikákról lesz szó. 
Ezt követően az információtömörítés két alapvető módszerét vesszük szemügyre 
(5. fejezet). A hatodik fejezet gráfokkal kapcsolatos algoritmusainak egy részét 
is szokás az adatszerkezetek témakörébe sorolni. Ilyenek a gyors bejáró módsze- 
rek és a rövid utak keresésére szolgáló eljárások. A gráfokról szóló részben olyan 
problémák is helyet kaptak, amelyek a kombinatorikus optimalizálás alapjaihoz 
tartoznak (hálózati folyamok, párosítások). 

A hetedik fejezetet a Turíng gépeknek szenteltük. Ennek az alapvető gépmo- 
dellnek az ismertetése után a kiszámíthatóság elemei következnek (rekurzivitás, 
eldönthetetlenség). Itt foglalkozunk a Kolmogorov-bonyotultság első tulajdonsá- 
gaival, és itt kapott helyet a közvetlen elérésű gép definíciója is. 

A nyolcadik fejezetbe kerültek az algoritmusok bonyolultságával kapcsolatos 
alapvető eredmények. Az idő- és tárkorlátokkal megadott nyelvosztályok beveze- 
tése után az NP feladatosztály tárgyalására térünk. Komoly figyelmet szentelünk 
az osztály nehéz feladatainak, az NP-teljes nyelveknek. 

A kilencedik fejezetben algoritmustervezési módszerekkel foglalkozunk. 
Olyan általános technikák ezek, amelyek feladatok széles körére alkalmazhatók. 
Példákon keresztül mutatunk be néhány ilyen megközelítést. Ezek a mohó mód- 
szer, az elágazás és korlátozás, a dinamikus programozás és a prekondícionálás. 
Fontosságuknak megfelelően kiemelten foglalkozunk a véletlent használó mód- 
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szerekkel. 

Az utolsó fejezetben rövid ízelítőt adunk a kriptográfiából, az illetéktelen hoz- 
záféréssel szemben biztonságos kommunikáció elméletéből. Ismertetjük a gyakor- 
latban is népszerű RSA kriptográfiai rendszert; ez lehetőséget ad több korábban 
tárgyalt fogalom, ismeret alkalmazására. 





Az anyag feldolgozásakor építünk az elemi függvényekkel, gráfokkal és egé- 
szek oszthatóságávak kapcsolatos alapvető tényekre. Feltételezzük még, hogy az 
olvasó ismeri egy általános célú programozási nyelv (mint pl. a Pascal vagy a C) 
utasításait. 

A könyvben Z jelöli az egész számok és R a valós számok összességét. A nem- 
negatív egész, illetve valós számok halmazára a Z, illetve Rt jelekkel hívatko- 
zunk. Ha f(r1, 72, .. ., 7) és gíri, 72, . . . , 7x) az (Rt )" egy részhalmazán értel- 
mezett valós értékeket felvevő függvények, akkor f — O(g) jelöli azt a tényt, hogy 
vannak olyan c,n 5 0 állandók, hogy Ifíz1, 72, . .., zx)I S elg(zi, x2, . . . , 2) 
teljesül, ha z; 2 n minden í — 1, 2, . . . , k esetén. 

Legyenek f(n) és gín) a pozitív egészeken értelmezett valós értékű függ- 
vények. Ekkor az f — o(g) jelöléssel rövidítjük azt, hogy f(n)/gín) — 0, ha 
na 00. 

Gyakran fogunk tömbökkel dolgozni, mégpedig legtöbbször természetes szá- 
mokkal indexelt tömbökkel. Például A[i : j) jelenti az A elnevezésű tömbnek az 
i indexűtői a j indexű eleméig terjedő részét; Afi) pedig a tömb i-indexű elemére 
utal. 


Végezetül köszönetet mondunk mindazoknak, akik bátorításukkal, a kézi- 
rathoz fűzött megjegyzéseikkel, tanácsaikkal támogatták munkánkat. Különösen 
sokat köszönhetünk Babai Lászlónak, Bródy Ferencnek, Demetrovics Jánosnak, 
Dömötör Adrienne-nek, Elekes Györgynek, Friedl Katalinnak, Herczog Sándor- 
nénak, Kovács Annamáriának, Szabó Lászlónak, Vank Ágnesnek és Vámos Tibor- 
nak. 


Budapest, 1998. július 20. 


A szerzők 


1. 


Algoritmikus problémák 
megoldása 


A tudományok nem próbálnak megmagyarázni semmit, alig-alig 
próbálkoznak értelmezéssel; főleg modelleket készítenek... Egy 
ilyen matematikai konstrukciónak csak és kizárólag az adja a 
létjogosultságát, hogy használható. NEUMANN JÁNOS 


Az egyik legfontosabb célunk, hogy a hatékony algoritmusok tervezésébe beve- 
zessük az olvasót. Mint a problémamegoldás általában, ez is sokszínű, többféle 
képességet igénylő kreatív folyamat. A problémával kapcsolatos ismeretek mel- 
lett komoly szerep jut az ötleteknek. Ezek olykor egyszerűek, mintegy maguktól 
adódnak, máskor komolyan meg kell dolgoznunk értük. Néha a megoldás szinte 
kiolvasható magából a feladatból, de az is előfordul, hogy csak komoly szellemi 
erőfeszítés árán jutunk előbbre. Nem várhatunk ezért biztos recepteket, amelyek- 
kel minden esetben célhoz érünk. Nem vagyunk ugyanakkor teljesen támasz híján 
sem. Mára az algoritmika a számítógépes tudományok eszközökben és módszerek- 
ben gazdag területévé nőtte ki magát. Kialakultak olyan fogalmak, megközelítési 
módok, melyek iránytűként segíthetnek bennünket a megoldások felé vezető úton. 
Ezen a területen is fontos szerepet játszanak a példák, az értelmes és sikeres meg- 
oldások tanulságai, amelyek sokszor túlmutatnak felmerülésük esetleges keretein. 

Ebben a rövid, bevezető jellegű fejezetben mi is példák segítségével szeret- 
nénk első képet adni tárgyunkról, az algoritmusok világáról. Az algoritmikus prob- 
lémák megoldását hasznos kétlépcsős folyamatként elképzelni, amit a következő 
egyszerű rajz szemléltet: 








/ Algoritmikus probléma 16 [modem 6] program 
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Az A leképezés azt a gyakran járt utat jelenti, hogy a problémát áttesszük, átfo- 
galmazzuk egy kellően absztrakt, többé-kevésbé formalizált modellbe. Ez a lépés 
általában pontosítást és egyszerűsítést jelent. Megszabadulunk a probléma megfo- 
galmazásában levő olyan elemektől, amelyek a megoldás szempontjából lényegte- 
tenek. Legtöbbször arról van szó, hogy a feladatot kihámozzuk abból a tarkabarka, 
természetes nyelvből szőtt köntösből, amiben elénk került. 

Az A lépés eredményének keretéül szolgáló modell sokféle lehet. Elég tágnak 
kel! lennie ahhoz, hogy a probléma megoldásához szükséges tényezőket hűen ki- 
fejezze. Másfelőt elég egyszerűnek is kell lennie azért, hogy kezelni tudjuk. A mo- 
dell — úgy képzeljük — valahol a félúton van a probléma és a megoldását adó prog- 
ram között. A modell formalizáltsága, pontossága közbülső lépcsőt jelent a prog- 
ramsorok szigorú egyértelműsége felé. Az igazán jó modellek fogalmai könnyen 
és standard módon képezhetők le számítógépes adatszerkezetekre. Olykor már ma: 
gában a modellben is helyet kapnak a megcélzott gépi környezet jellemzői, A mi 
sik oldalról nézve ezt a közbülső helyzetet azt is elvárjuk, hogy a modell mentes 
legyen a programnyelvi utasítások földhözragadtságától. Hogy tényleg lehetővé 
tegye azt. hogy a problémát valamiféle értelmes általánosság szintjén szemlélhes- 
sük. Divatos fordulattal élve a modellt tekinthetjük sokadik (legalább negyedik) 
generációs nyelvi eszköznek. 

A B leképezés jelenti a hatékony algoritmusok tervezését, kidolgozását. Ez a 
folyamat többnyire a modell által adott keretekből indul. Ezen a szinten már egy 
pontos algoritmikus problémával van dolgunk. Ennek összetevői a bemenő adatok 
(más szóval bemenet vagy input) megadása; valamint az eredménnyel, az outputtal 
kapcsolatos követelmények. 

A megoldó módszer első változatát a model! fogalmaival fejezzük ki. Ezt a 
nagyvonalú megoldást lehet azután már többé-kevésbé mechanizálható lépésekkel 
tényleges programmá finomítani. A későbbiek során legtöbbször ezzel a B lépés- 
sel, annak is az első részével, a nagyvonalú megoldás kialakításával foglalkozunk. 
A munkának ebben a fázisában érdemes foglalkozni a kapott algoritmus elemzé- 
sével, értékelésével, megvizsgálva, hogy a módszer mennyire hatékony, mennyit 
lehetne még javítani rajta, 

Az itt vázolt képben sok egyszerűsítés van. Ezek közül talán a legsúlyosabb, 
hogy a problémamegoldás folyamatát magabiztos, mindig csak előre való masí- 
rozásként tünteti fel. Ez a valóságban legtöbbször nem így van. Gyakran kény- 
szerülünk arra, hogy visszaforduljunk egy zsákutcának bizonyuló irányból, és egy 
korábbi pontból új utat keressünk. 

Ennyi általánosság után néhány egyszerű példával szeretnénk érzékeltetni az 
eddig elmondottakat. A példák bevezető jellegűek; a felmerülő fogalmakat később 
részletesebben fogjuk tárgyalni. 
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1.1. A feladattól a modellig 


Itt az A leképezésre szeretnénk néhány példát mutatni. A modell, amibe átírjuk 
a problémákat, tulajdonképpen egyetlen egyszerű fogalomra, a gráfra épül. En- 
nek az egyszerű fogalomnak az atkalmazásával az eredeti problémák tiszta, pontos 
megfogalmazását kapjuk. 


1.1.1. Közlekedési lámpák ütemezése 


Képzeljük el, hogy egy űtkereszteződés közlekedési lámpáinak a működését kell 
megterveznünk. Tegyük fel, hogy a kereszteződésben (északról indulva, órajárás 
szerint) az a, b, c, d, e egysávos utak találkoznak. Az a, b és e utak a kereszteződés 
felé, a többi pedig a kereszteződéssel ellentétes irányban egyirányú. 


Mm 


Ape 


Tegyük fel. hogy minden értelmes, a nyilakat követő áthaladási irányhoz van 
egy közlekedési lámpánk. Ezek az irányok esetünkben ac, ad, be,bd,ec és ed. 
Összesen tehát hat lámpánk van. Például az ac irány lámpája csak az ebben az 
irányban való átjutást szabályozza (tiltja, illetve engedélyezi). Ennyi a probléma 
leírása. 

Ezután elkezdhetünk gondolkodni. Mi ís a feladat tulajdonképpen? Némi tűnő- 
dés után arra jutunk, hogy a lámpákból álló rendszer számunkra érdekes állapotait 
egy-egy lámpák — (piros, zöld ) függvényként foghatjuk fel. Ezzel máris egysze- 
rűsítettük a képet, felismerve, hogy a sárga színnek nincs komoly szerepe a feladat 
szempontjából. Például a jujj nevű állapot (függvény) lehet a következő: 


jujj(ac) — jujjtad) — jujjíba) — zöld, 
jujjlbe) — jujjl(ed) — jujjlec) — piros. 
Ezt az állapotot nem szabad megengednünk. hiszen például az ac és bd irányok 


találkoznak. E két iránynál nem lehet egyszerre mindkét lámpa zöld. Kis további 
gondolkodás után oda jutunk, hogy az ilyen konftiktuslehetőségek megfoghatók 
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mint irányokból álló párok. Példáut (ac, bd) egy tiltott pár, (ac, ad) pedig nem. A 
kapcsolat szimmetrikus, nincs különbség mondjuk az (ac, bd) és a (bd, ac) párok 
megítélése között. 

Mindezek azt sugallják. hogy próbáljuk meg gráffal ábrázolni a helyzetet. A G 
gráfunk csúcsai az áthaladási irányok: ac, ad, be, bd, ec és ed. Két csúcsot akkor 
kössön össze él, ha az irányok konfliktusban vannak. Más szóval, ha a megfelelő 
két lámpa nem lehet egyszerre zöld. Egy állapot akkor engedhető meg, ha a benne 
levő zöld csúcsok között nem fut él. További egyszerűsítést jelent az a felismerés, 
hogy egy állapotot jeliemezhetünk pusztán a benne levő zöld csúcsok halmazával. 

Ezután megpróbálkozhatunk a feladat pontos megfogalmazásával. Az első vál- 
tozat így hangzik: adjunk meg minél kevesebb állapotot úgy, hogy egyfelől a meg- 
adott állapotok mind biztonságosak legyenek; másfelől ne legyen olyan áthaladási 
irány, amelyhez az összes megadott állapotban a piros szín tartozik. Az utóbbi fel- 
tétel azt hivatott szavatolni, hogy nem okozunk örök dugót. 

A G gráf segítségével ez még egyszerűbben kifejezhető. Úgy kell a G csúcs- 
halmazát minél kevesebb osztályba (részhalmazba) sorolni, hogy az egy osztály- 
ban levő csúcsok között ne menjen él. Esetünkben ilyen osztályozás az fac, adj, 
fbe,bd), fec,ed). A rajzon római számmal tüntettük fel a csúcsok osztályának 
sorszámát. 





Feladat: Mutassuk meg, hogy két osztállyal nem oldható meg a probléma. 


Mi történt itt valójában? Az eredeti feladatot átfogalmaztuk a gráfok nyelvére, 
eltüntetve belőle olyan, a vizsgált kérdés szempontjából érdektelen elemeket, mint 
közlekedés", , út", stb. Ebben a modellben lényegében csak csúcsok és őket össze- 
kötő élek szerepelnek. Valamivel pontosabban egy G — (V, E) gráf két összetevő- 
ből áll. Az egyik a csúcsok (pontok) V halmaza, a másik pedig E, az élek összes- 
sége. Az E halmaz bizonyos V-beli párokból áll. Rajzon szemléltetve a csúcsokat 
pontokkal ábrázoljuk, az éleknek megfelelő párok tagjait pedig vonallal összeköt- 
Jük. Az átfogalmazás után az eredeti feladat egy klasszikus gráfelméleti probléma 
algoritmikus változatához vezet. 
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Definíció (színezés, kromatikus szám): 

A G gráf k-színezésén egy f : V — (I1,...,k) leképezést értünk, melvre ha 
(v,w) € E, akkor f(v) A f(w). A G kromatikus száma a legkisebb k érték, 
melyre van G-nek k-színezése. A G kromatikus számának a jele xX(G). 


A lámpák ütemezésének problémája tehát egy gráf kromatikus számának, il- 
letve ennek megfelelő színezésnek a meghatározásához vezetett, Ezzel az úgyne- 
vezett színezési feladattal később még találkozni fogunk. 

Az A leképezéshez tartozó modelltől azt is elvárjuk, hogy elemei jól ábrá- 
zolhatók legyenek számítógépes adatszerkezetekkel. A gráfokra ez teljesül. Egyik 
természetes ábrázolási módjuk az adjacencia mátrixszal való megadás. Ha a gráf 
V csúcshalmazának n eleme van, akkor az A adjacencia mátrixa egy n-szer n-es 
mátrix. Legyen az egyszerűség kedvéért V — (1, ... ,n). Ekkor 


a. f0 balij) £E 
Aha f 1 ha(ij) ek. 


Az A mátrixot tekinthetjük kétdimenziós A(I : n,1 : n] egész, vagy Boole 
típusú tömbnek. Modellünk fogalmai ezen az úton könnyen és hajlékonyan ábrá- 
zolhatók számítógépes adattípusokkal, 


1.1.2. Arthur király civilizációs törekvései 


Arthur király fényes udvarában 150 lovag és 150 udvarhölgy él. A király, aki köz- 
ismert civilizációs erőfeszítéseiről, elhatározza, hogy megházasítja jó lovagjait és 
szép udvarhölgyeit. Mindezt persze emberségesen szeretné tenni. Csak olyan pá- 
rok egybekelését akarja, amelyek tagjai kölcsönösen vonzalmat éreznek egymás 
iránt. Hogyan fogjon hozzá? Természetesen pártfogójához, a nagyhatalmú vari 
lóhoz, Merlinhez fordul, Merlin rögvest felismeri, hogy itt is bináris szimmetrikus 
viszonyok ábrázolásáról van szó. Nagy darab pergament vesz elő, és nekilát gráfot 
rajzolni. A pergamen egyik felén levő U ponthalmaz az udvarhölgyeket jelenti. A 
másik oldalra kerül a 150 pontú L halmaz; ez pedíg a lovagokat ábrázolja. Az 
lovagnak megfelelő pont és az u udvarhölgy pontja közé élet rajzol, ha ( és u köl- 
csönösen kedvelik egymást, A modell, amit a mú használ, a páros gráf. Ebben 
a pontok V halmaza két egymást nem metsző rész egyesítése; él csak a két rész 
között futhat. 














Definíció: A G — (V; E) gráf egy páros (kétrészes) gráf, ha a V csúcshalmaz 
felbontható két nem üres L és U részre úgy, hogy LNU - 0, LUU — V. és ha 
(vi, v2) € E. akkor a vi és va csúcsok egyike U -ban, a másika pedig L-ben van. 
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A királyi parancs teljesítéséhez Merlinnek élek egy olyan rendszerét kel! ki- 
választania a gráf éleiből, hogy a kiválasztott élek közül a gráf minden pontjához 
pontosan egy csatlakozzon, A kiválasztott élek felelnek meg a tervezett házassá- 
goknak. A gráfelmélet nyelvén teljes párosítást kell keresnie. 


Definíció: A G — (LU; E) IL 1-1 U 1- n kétrészes gráf éleinek egy SCE 
részhalmaza teljes párosítás, ha az (L, U; 5) gráfban minden pontból pontosan 1 
él indul ki. 





Merlinnek tehát a pergamenre rajzolt gráf egy teljes párosítását kellene megad- 
nia. Ha a legenda főváltozatát fogadjuk el hitelesnek (a Sir Thomas Malory által írt 
La Morte d Arthurt), akkor arra jutunk, hogy a feladatnak nincs megoldása. Isme- 
retes ugyanis, hogy Arthur és Sir Lancelot is csak és kizárólag Guinevere királyné 
iránt érez vonzalmat. Hogyan járuljon mármost Merlin a nagyúr elé, aki nem örül 
túlságosan, ha parancsát nem teljesíttk? A király az Excalibur után kapkodó 1ob- 
banékonyságán kívül éles elméjéről is nevezetes. Merlin így megmentheti fejét. 
Annyit kell tennie, hogy megmutatja a rajz megfelelő részletét (amiből kitűnik, 
hogy Arthur és Lancelot is csak Guinevere-rel van összekötve) a királynak, aki a 
bizonyíték hatására békésen eláll tervétől. 

Általánosabban fogalmazva ugyanez lenne a helyzet, ha tetszőleges k ese- 
tén van k lovag úgy, hogy a kedvenceik kevesebb, mint k udvarhölgy közül 
kerülnek ki. A megfelelő fogalom a gráfok világából a König-akadály. Legyen 
G - (LU; E) egy kétrészes gráf, ] L j-] Ú I. A nem üres X C L csúcshalmaz 
egy König-akadály, ha van olyanY C U,] Y IA] X I, hogy X-ből minden él 
Y-ba megy. Igazolható, hogy pontosan akkor nincs G-ben teljes párosítás, ha van 
benne König-akadály. Ezt tudva tovább pontosíthatjuk a feladatot: keressünk G- 
ben teljes párosítást, vagy egy König-akadályt, ha nem létezik teljes párosítás. Az 
utóbbi esetben világos bizonyítékot kapunk arra, hogy az eredeti feladatnak nincs 
megoldása. Az A leképezés ezúttal is segített tisztábbá tenni az eredeti feladatot. 
A modellel — jelen esetben a gráfokkal — kapcsolatos ismeretek komoly segítséget 
jelentettek a feladat értelmes és pontos megfogalmazásában, 


Feladat: Arthur király kifogyhatatlan az ötletekből, ha a kulturált viselkedést kell 
előmozdítani Camelot várában. Legutóbb például feltalálta a késsel-villával való 
étkezés misztériumát. Azt szeretné, ha lovagjai ezentúl nem puszta kézzel nyúl- 
nának a falatokhoz a Kerek Asztal melletti nagy lakomákon. Félő azonban, hogy 
a nyers modorú bajnokok eme szúró-vágó eszközök birtokában megpróbálják ki- 
egyenlíteni számláikat az asztalszomszédjaikkal. Az ilyen csetepaték elkerülésé- 
hez úgy kellene leültetni a lovagokat, hogy az asztalszomszédok között ne feszül- 
jön ellenséges érzelem. Merlin feladata ezúttal egy olyan, a Kerek Asztal körüli 
ülésrend készítése, mely szerint senki.sem kerül haragosa mellé. Ismert, hogy kik 
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nem állnak hadilábon egymással (ismét egy bináris szimmetrikus relációval le- 
írható kapcsolat). Próbáljuk gráfok segítségével megfogalmazni a problémát. Mi- 
lyen objektum keresésére vezet a feladat? 


1.2. Algoritmusok 


Két példát mutatunk ezután a B lépésre. Itt már kellően absztrakt, ugyanakkor 
gépközeli modellben megfogalmazott algoritmikus problémák megoldásáról lesz 
szó. Először egy irányított gráfokról szóló feladatot veszünk górcső alá. 


1.2.1.  Szuperforrás keresése 


Az előző feladatok irányítatlan gráfokhoz vezettek. Nem tettünk különbséget az 
(u, v) és a (v, u) pár között. Ha az egyik E-be tartozott, akkor a másik is. Az irá- 
nyított gráfok abban különböznek ettől, hogy az (u, v) él megléte nem feltétlenül 
jelenti a (v, u) él meglétét a gráfban. Ennek megfelelően az A adjacencia mátrix 
nem feltétlenül szimmetrikus, mint az eddigi példákban. Ha egy ilyen gráfot raj- 
zolunk le, akkor az (u, v) € E élet ábrázoló vonalra v felé mutató nyilat teszünk. 
Most egy olyan feladattal fogunk foglalkozni, ami már kellően pontos megfogal- 
mazásban ál! rendelkezésünkre. 





Definíció: A G irányított gráf s € V csúcsa szuperforrás, ha minden 8-től külön- 
böző y € V csúcs esetén teljesül, hogy (s,y) € E és (y,5) £ E. 


A szuperforrás olyan s csúcs, amiből a gráf minden más csúcsába él vezet; az 
$-be pedig egyetlen más csúcsból sem megy él. Nyilvánvaló, hogy egy gráfban 
legfeljebb egy szuperforrás lehet. 

A feladat a következő: tegyűk fel, hogy az A adjacencia mátrixával adott a 
G -— (V, E) irányított gráf, aminek a csúcshalmaza V — ÁL, . . . ny. Döntsük el, 
hogy van-e G-ben szuperforrás. Ha igen, találjuk meg. 


Egy megoldás rögtön kínálkozik. Sorra vesszük az i € V csúcsokat, mind- 
egyikről megnézve, hogy szuperforrás-e. Az í csúcs vizsgálata során az í-be menő 
és az i-ből kiinduló élek hiányát illetve meglétét kell ellenőrizni. Ez lényegében az 
A mátrix i-edik sorának és i-edik oszlopának a végignézését jelenti. 

Mindjárt felmerül a kérdés, hogy mennyire jó a kapott megoldás. Nem 
lehetséges-e ennél hatékonyabb, gyorsabb módszer? Hogy erre válaszolni tudjunk, 
mérnünk kel! valahogy a módszereink hatékonyságát, sebességét. Meghatározhat- 
nánk például a programunkban szereplő elemi utasítások végrehajtási idejét, ami- 
ből aztán becsülhető lenne a futási idő a különböző n értékekre. Az így kapott 
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mérőszám egyrészt kissé nehézkes: többféle elemi utasítás idejét kellene kímérni. 
Másfelől túlságosan gépfüggő is: más környezetben ezek az elemi idők egészen 
máshogyan alakulhatnak. Ezek a problémák azt sugallják, hogy keressünk valami 
egyszerű. gép- és környezetfüggetlen mérőszámot. Az algoritmus sebességét mérő 
szám legyen az A mátrix megvizsgált elemeinek a száma. 

Első megoldásunkról kiderül, hogy nem valami fényes. Az A mátrix minden 
főátlón kívüli elemét megnézzük, mégpedig kétszer. Az összköltség 2(n2 — n) 
ilyen vizsgálat. 

A következő módszer azon az egyszerű észrevételen alapul, hogy hai £ j 
esetén (i, j) € E, akkor j nem lehet szuperforrás, (i,j) g E pedig í-t zárja ki. 
Úgy is fogalmazhatunk, hogy Ali, j] értékének ismeretében vagy i, vagy j biztosan 
kizárható mint lehetséges szuperforrás. Hogy a kettő közül melyik lesz a kizárt 
csúcs, az függ Ali, j] értékétől, de egyiktől mindenképpen megszabadulhatunk. 
Ezzel az ötlettel gyorsan tudjuk szűkíteni a tudomásunk szerint még lehetséges 
szuperforrások körét. 


size; 
while í - j do 
if Ali, j) — 1 then 





elsei:— 1-1; 
(" Amikor ideérünk, már csak i lehet szuperforrás, 
ezt ellenőrizzük a továbbiakban. ") 
fork-1tondo 
ifk A i és (Alí,k] A 1 vagy A[k, i) A 0) then return(nincs szuperforrás) 
return(i szuperforrás). 


Az eljárás magától értetődő. Az első ciklus leszűkíti a keresést egyetlen je- 
löltre. A második ciklus ezt az egy szem jelöltet ellenőrzi. Nézzük most a módsze- 
rünk hatékonyságát! Evégből először felső becslést adunk a költségére. A while- 
ciklus végrehajtása során az A tömb n — 1 elemét vizsgáljuk meg. Utána már csak 
az i-edik sor és oszlop elemeit kell néznünk; ez további 2n — 2 hely. Összesen tehát 
legfeljebb 3n — 3 mátrix-elem megtekintését igényli az algoritmus. 

Jelölje T(n) a legjobb (leggyorsabb) algoritmus által megvizsgált mátrix- 
elemek számának maximumát az összes n pontú gráfra. Eddigi fejtegetésünk sze- 
rint T(n) £ 3n — 3, hiszen van egy módszerünk, ami megoldja a feladatot ennél 
nem több lépésben. Hogy a módszerünket értékelhessük, alsó becslést kell adnunk 
T(n)-re. Ennek segítségével képet kaphatunk arról, hogy eljárásunk teljesítménye 
mennyire tér el a lehető legjobb módszerétől. Algoritmikus problémák elemzése- 
kor általában igen nehéz érdemi alsó becsléseket nyerni; ezt valamennyire érthe- 
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tővé teszi az, hogy egy ilyen korlát az összes algoritmusra érvényes megállapítás. 
A szuperforrás-feladat ilyen szempontból szerencsésnek mondható. Nyilvánvaló, 
hogy 2n — 2 £ T(n), hiszen ennyi elemet meg kell néznünk pusztán ahhoz, hogy 
egy adott csúcsról ellenőrizzük, hogy szuperforrás-e. 

Ennél élesebb korlátot kaphatunk a következő észrevétellel: § él megkérdezése 
legfeljebb 1 csúcsot zár ki mint lehetséges szuperforrást. Ha ugyanis az Al, j) 
vizsgálata előtti tudásunk szerint i és j is lehet még szuperforrás, akkor Ali, j]) — 1 
esetén i, Ali, j) — 0 esetén pedig j továbbra is a jelöltek között marad. Az í-től és 
Jj-től különböző csúcsok megítélésén a válasz nem változtat. 

Arra juthatunk mindebből, hogy a legjobb algoritmus első n — 2 kérdése után 
még legalább két csúcs — mondjuk i és j — lehet szuperforrás. Ez azt jelenti, hogy 
az A táblázat még nem nézett részének lehet olyan kitöltése, amely szerint í lesz 
szuperforrás, és olyan is, amelynél j a szuperforrás. Eddig összesen az A mátrix 
n — 2 elemét néztük meg. A megvizsgált elemek közül tehát valamelyik pontunk 
(mondjuk az i) sorába és oszlopába legfeljebb (n—2)/2 esik. Képzeljük el, hogy az 
ellenség" úgy tölti ki az A még nem nézett elemeit, hogy í legyen a szuperforrás. 
Ez is egy lehetséges bemenete (inputja) a feladatnak; a legjobb algoritmusnak erre 
is működnie kell. Hogy az i szuperforrás-tulajdonságát igazolja, A[í, i) kivétetével 
ismernie kell az i-edik sor és oszlop értékeit. Ez még legalább 2n — 2 — (n — 2)/2 
kérdést jelent. Innen kapjuk, hogy 


T(n) 22n-2—-(n—2)/23-n-253n—4—(n—2)/2. 


Az érvelés tanúsága szerint legfeljebb n/2 kérdés erejéig megközelítettük az opti- 
mumot. Elmondhatjuk, hogy gyors és egyszerű algoritmusunk van a feladat meg- 
oldására. Az első módszerhez képest a javulás drámai; például han — 500, akkor 
az A mátrix 250 000 eleméből legfeljebb csak 1497-et vizsgáltunk meg. Megje- 
gyezzük, hogy ennél jobb alsó korlát is adható; ebből kiderül, hogy a módszer 
nagyon közel van az optimálishoz. 


Feladat: Mutassuk meg, hogy T(n) 2 3n — 3 — log; n. (Az ellenség-módszer 
alkalmazható. Az A mátrix bizonyos elemeinek megkérdezése utáni helyzet po- 
tenciálja legyen 3, 25; az összegben azok az i csúcsok szerepelnek, amelyek az 
adott helyzetbeli ismeretek szerint még lehetnek szuperforrások, k; pedig az A 
1-edik sorából és oszlopából már ismert értékek száma. Az ellenség stratégiája: 
ha lehet, úgy válaszoljon az algoritmus kérdésére, hogy a szuperforrás-jelöltek ne 
fogyjanak; ha ezt nem teheti, akkor úgy válaszoljon, hogy a potenciál ne nőjön.) 

A feladat érdekessége, hogy megoldható volt úgy is, hogy az A adjacencia 
mátrix n? elemének csak egy töredékét néztük meg. Ez a jelenség elég ritka a ter- 
mészetesen felmerülő gráftulajdonságok körében. Legtöbbször az egész mátrixot 
végig kell néznünk a megoldás során. 
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Érdemes megfigyelni az alsó becslésnél alkalmazott ellenség-módszert. A fel- 
tételezett legjobb algoritmus bizonyos kérdéseire adaptívan válaszoltunk: az al- 
goritmus korábbi lépéseitől függően határoztunk meg néhány Ali, j) értéket. Így 
találtunk egy olyan bemenetet, amely a módszert (viszonylag) sok munkára kény- 
szerti. 


1.2.2. Hosszú egészek párhuzamos összeadása 


Ha [a kivonásnál] semmi sem marad, írj egy köröcskét, hogy a hely 
ne maradjon üresen, A köröcskének kell elfoglalnia ezt a helyet, mert 
másképp kevesebb hely lenne, és például a másodikat hinnénk elsőnek, 

MOHAMED IBN MÚSZA (AL KHVARIZMI) a nulláról, 


Itt ismét egy már pontosan megfogalmazott feladatról lesz szó, mégpedig olyan- 
ról, amelyet mindenki régóta ismer. Tegyük fel, hogy adottak a decimálisan írt 
4192 . . . ün ÉS b1b2 . . . ban n-jegyű természetes számok. Számítsuk ki az összegük 
€0e1€2 . . . én decimális rendszerbeli alakját. Ez a legelső valamire való algoritmi- 
kus probléma, amivel az iskolában találkoztunk. Bizony, rengeteget gyakoroltuk a 
hindu-arab-algoritmust, amivel jobbról balra haladva kitölthetjük az alábbi táblá- 
Zat alsó sorát. 1 





Aa ag 2... ún-1  ün 
kb b...  bn-i bn 
€0 EL €Z 7...  én-i én 


Összesen 2n — 1 egyjegyű összeadás árán megkapjuk az e; számjegyeket: 
mindegyik i-re kiszámoljuk a helyi a; -- b; összeget (n elemi összeadás), és ehhez 
még hozzáadjuk az átvitel értékét (n — 1 egyjegyű összeadás). A módszer gyors 
és praktikus. Tulajdonképpen a bemenet hosszával arányos lépésszámban, lineá- 
ris időben megkapjuk az eredményt. Hasonlót mondhatunk arra az esetre, amikor 
a műveletet számítógép segítségével végezzük. Ha n viszonylag kicsi, akkor a 
számaink egy-egy gépi szóban ábrázolhatók, és a feladat egyetlen gépi összeadás- 
sal megoldható, Ha a számok nagyon hosszúak, akkor a hindu-arab-algoritmus 
mintájára járhatunk el. A különbség annyi, hogy az elemi lépéseket a gépünk szó- 
hosszától függő méretű többjegyű számokkal végezzük. A műveletek száma így is 
arányos lesz a bemenet hosszával; az arányossági tényező a szóhossz függvénye. 
Az ősi módszer tehát hatékony megoldást nyújt mind a kézi, mind pedig a szokásos 
értelemben vett gépi számoláshoz. 

Mit tehetünk akkor, ha a feladat megoldására több processzorunk (számítógé- 
Pünk) van, amelyek egyidejűen, párhuzamosan dolgozhatnak? Tudjuk-e így lénye- 
gesen csökkenteni a számolás idejét? Némi kísérletezgetés után rájövünk, hogy a 
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fő gondot a teendők értelmes szétosztása jelenti. Úgy kellene megszervezni a mun- 
kát, hogy a processzorok dolgozhassanak anélkül, hogy túl sokat kelljen várniuk 
egymásra. Példaképpen nézzük a 843712 és 156288 számok összegét. Megtehet- 
nénk, hogy minden helyiértékhez egy processzort rendelünk, amely elvégzi az ott 
levő jegyek összeadását. Az utolsót kivéve mindegyik 9-et kap eredményül. Utána 
várniuk kell a jobb felől érkező átvitelre. A bal szélső processzor csak az összes 
többi után fejezheti be a munkát; meg kell várnia, amíg a jobb szélről az 1-es átvi- 
tel végigballag a processzorokon. Az idő így ismét arányos lesz az összeadandók 
hosszával, ami azt jelenti, hogy nem értünk el jelentős gyorsulást. 

A párhuzamos algoritmusok tervezésében tipikus az itt vázolt helyzet. A meg- 
oldáshoz vezető teendőket kell minél inkább párhuzamosítani, függetlenül végez- 
hető részfeladatokra bontani. Vannak olyan feladatok, ahol ez szinte magától ér- 
tetődő, mint mondjuk a kukoricatörésnél, ahol a munkások külön-külön sorban 
dolgozva, egymástól függetlenül tevékenykedhetnek. Az ilyen esetekben ideális 
gyorsulás érhető el; ha t munkás van, a szükséges idő a t-edrészére csökken. Más 
feladatoknál a párhuzamosítás sokkal nehezebb; úgy találjuk, hogy a processzo- 
rok között jelentős egymásra utattsá; zágúti kerékpáros csapatversenyt 
említhetjük példaként. Finoman összehangolt munkával négyen együtt gyorsab- 
ban legyűrik a távot, mint azt egy ember tenné. De szó sincs arról, hogy negyedére 
csökkenne a szükséges idő. Az utóbbi egy nehezebben párhuzamosítható feladat. 

Itt most egy erőteljesen párhuzamos megoldást adunk hosszú egészek össze- 
adására. Mint látni fogjuk, lesz egy kis huncutság a dologban. A szélvészgyors 
megoldás úra az, hogy az eredményt nem a megszokott formában kapjuk. 




















Definíció: A 97721 ai1077", 0 £ a; c 9 alakú számábrázolást standard ábrá- 
ük. A Ja aa 10777, —9 £ a; S 9 alakú számábrázolást pedig 
kiegyensúlyozottnak revezztik. 


zolásnak neve; 





A standard ábrázolás tehát a szokásos decimális felírást jelenti, ahol a meg- 
engedett számjegyek a 0, 1, .9. A kiegyensúlyozott ábrázolásban tizenkilenc 
jegyet használhatunk. Ezek: —9,—8,...,—I,0, I, . . . , 8.9. Tudjuk, hogy a stan- 
dard alakban való felírás egyértelmű. Az így ábrázolt számokról könnyű megálla- 
Pítani, hogy melyik a nagyobb. A kiegyensúlyozott ábrázolás nem egyértelmű, az 
ilyen számok összehasonlítása elég körülményes. A többértelmű felírásnak van ví- 
szont egy olyan előnye, ami segíteni fog abban, hogy megállítsuk az átvitel hosszú 
futását az összeadásnál. 





Állítás: Tetszóleges —18 £ a £ 18 egésznek van olyan kiegyensúlyozott ábrá- 
zolása, melyben nincs --9-es és —9-es jegy, továbbá a I0-es helyiértékű jegy -1.0 
vagy I. 
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Bizonyítás: Ha a 7 9 és a / —9, akkor a standard alak megfelelő. A kimaradó 
két számnál a 9 — 10 — 1 és —9 — —10 4-1 egyenlőségeket használhatjuk. A 
kiegyensúlyozott felírások ekkor 1 — I, illetve —11. 0 


Ezután ismertetjük Avizienis algoritmusát két n-jegyű kiegyensúlyozott fel- 
írású szám összeadására. AZ ajJ...an ÉS bi...bn n-jegyű egészek ege , . . en 
kiegyensúlyozott alakú összegét fogjuk megkapni. Az algoritmus n processzort 
használ, ezek közül az í-edik processzor az i helyiértékű jegyeken dolgozik. Az 
első lépésben párhuzamosan kiszámítják az a;--b; összeg egy olyan (kétjegyű) esd; 
kiegyensúlyozott reprezentációját, amilyet az állítás szavatol: a; 4- b; — c;10 4 d;, 
ahol cz; € (—1,0,1) és -8 £ d; S 8. A második lépésben csak az 1. és n. pro- 
cesszorok dolgoznak, megadva a végeredmény első és utolsó jegyét: eg — ci, 
€n — dn. A harmadik, egyben utolsó lépésben az i-edik processzor 1 Si £n-1 
egyetlen összeadással megkapja ez-t: ez; — d; -- Ci 41. A módszer helyessége abból 
adódik, hogy az í-t- 2, . . . , n helyiértékeknél kapott eredmények nem befolyásolják 
azí-k 1. helyről az í-edikre menő átvitel értékét. A d;4 a jegy ugyanis -8 és 8 közé 
esik, amit a jobbról jövő —1, 0, vagy 1 átvitel nem tud 9 fölé, vagy -9 alá vinni. 
Az első lépésben számított cs4.4 érték tényleg a helyes átvitel, amit az í. helyen 
figyelembe kell vennünk. A számítás menete így szemléltethető: 














a1 út an-1 an 
bi Ya buzi ba 

1. lépés: cidirsai bbi gú €n—1dn- 

2.Jépés:  eo:szes 

3. lépés: e1:zdí-tez 93 én-1"zdn-1 tén 


Nézzük meg, hogy fest ez egy konkrét példán. A korábban problémásnak mi- 
nősült 843712 és 156288 számokon követjük a módszer lépéseit. Csak a kapott 
részeredményeket tüntetjük fel. 











8 4 kj 7 1 2 

§ 3 6 2 8 8 
1. lépés: 1-1 1—1 1-1 1-1 1-1 10 
2.lépés: 1 [1 
3. lépés: 0 0 [/ 0 0 





Összeg: 1 0 o o o 0 o 


Avizienis algorítmusával tehát konstans párhuzamos időben megkaptuk az 
eredmény egy kiegyensúlyozott reprezentációját. Ezzel a kukoricatörésnél tapasz- 
talthoz hasonló ideális felgyorsítást sikerült elérni. 

Egy n-jegyű kiegyensúlyozott szám standard alakra hozására csak viszony- 
lag lassúnak mondható, elogn párhuzamos lépést igénylő módszer ismert. Ezt 
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használva 0(log n) párhuzamos idejű módszer adódik két n-jegyű egész standard 
felí sszegének a meghatározására. Avizienis módszere különösen akkor hasz- 
nos, ha sok összeadást kel) elvégeznünk egyszerre, Erre a helyzetre értelmes példát 
kínál a szorzás. 









Feladat: Mutassuk meg, hogy két n-jegyű egész szorzása elvégezhető O(log n) 
párhuzamos időben. (Az iskolában tanult szorzóalgoritmus összeadásait Aviztenis 
módszerével végezhetjük el; csak a végeredményt írjuk át standard formába.) 








A módszer kulcsa a 9-es nélküli felírhatóságról szótó állítás. Ez kézenfekvően 
általánosítható tetszőleges k 5 2 alapú számrendszerre; ekkor a 9-es szerepét k— 1 
játssza. A gyakorlatban a négyes számrendszert használják, mert a gépeken szo- 
kásos kettes számrendszer és a négyes számrendszer közötti átalakítások gyorsak. 





Feladat: Adjunk konstans párhuzamos idejű módszert kettes számrendszerben 
adott számok négyes számrendszerbeli átívására, és a fordított irányú átalakításra. 


A hosszú egészek összeadásának feladatával azt ís szerettük volna érzékeltetni. 
hogy a megoldás hatékonyságáról való képünk függ attól is, hogy milyen számító- 
gépes eszközök állnak a rendelkezésünkre. A megoldás keresése során ezért figye- 
lemmel ket! lennünk erre a háttérre. Úgy is fogalmazhatunk, hogy az eszköz-háttér 
alapvető jellemzői (mint pl. a processzorok száma) részét képezik a modellnek, 
amivel dolgozunk. 


2: 
Rendezés 


...egész nap a barlangban szorgoskodtam, ahol a vert pénzt kellett 
kétszersültes zsákokba töltenem... azt hiszem, sohasem szórakoztam 
jobban, mint amikor ezeket rendezgettem. Angol, francia, spanyol, 
portugál aranyak, György és Lajos tallérok, dublónok, kettős gui- 
neák, monédorok és zecchinók. ROBERT LOUIS STEVENSON 

(Jim emlékei a Kincses Szigetről) 


Ebben a fejezetben az egyik klasszikusnak számító, alapvető számítási feladattal, a 
rendezéssel foglalkozunk. Ennek értelmezéséhez nézzük először a rendezési relá- 
ció fogalmát. Legyen U egy halmaz, és — egy kétváltozós reláció U-n. Haa,b € U 
és a c b, akkor azt mondjuk, hogy a kisebb, mint b. A c reláció egy rendezés, ha 
teljesülnek a következők: 
1.a £ a minden a € U elemre (c irreflexív); 
2.Haab,cE€ U,a c b, és b £ c, akkor a c c (c tranzitív); 
3. Tetszőleges a / b € U elemekre vagy a c b, vagy b — a fennáll (c teljes). 

Ha c egy rendezés U-n, akkor az (U, €) párt rendezett halmaznak nevezzük. 
Ha az (/ halmaz egy számítógépes adattípus is egyben, akkor az (U, €) párt ren- 
dezett típusnak is nevezik. Különösen ez utóbbiak érdekesek a számunkra. Az U 
elemeit ekkor adatoknak tekinthetjük, és feltehetjük, hogy a — reláció hatékonyan 
a rendelkezésünkre áll: ha adottak az a, b € [ elemek, akkor az a € b viszony 
ellenőrzése, más szóval a és b összehasonlítása hatékonyan megtehető. Ezt az 
összehasonlító eljárást gyakran a rendszer biztosítja, olykor viszont magunknak 
kell megírnunk. 
Példák: 
1. Z az egész számok halmaza. A — rendezés a nagyság szerinti rendezés, (Z, c) 
tekinthető rendezett típusnak is. 
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2. Az abc betűinek E halmaza; a c rendezést az abc-sorrend adja. Az x betű ki- 
sebb, mint az y betű, ha z előbb szerepel az abc-sorrendben, mint y. 

3. A 2 betűiből alkotott szavak 5" halmaza a szótárszerű vagy lexikografikus ren- 
dezéssel. Ezt a következő recepttel értelmezhetjük: legyen X — xir2:::Tp ÉS 
Y s yiy2 yi (my € 2) két szó (X az zx;. Y pedig az yj betűk sorozata). Az 
X kisebb mint Y, ha vagy I 5 kész; — ywhai — 1, 2, .. . ,k; vagy pedig rj € yj 
teljesül a legkisebb olyan j indexre, melyre x; 7 yj. Tehát például kar c karika 
és bor € bot. 


A rendezés feladata általánosan így fogalmazható: adott az (U, c) rendezett 
halmaz elemeinek egy 1, u2, . . . , un sorozata; rendezzük ezt át egy nem csökkenő 
V1, 025... . , Un sorrendbe. 





A nem csökkenő sorrend azt jelenti, hogy vi £ v2 £ ... £ Un teljesül, ahol 
A a kisebb vagy egyenlő reláció jelölése. Az egyenlőséget akkor kel! megenged- 
nünk, ha az u; sorozatban ismétlődések vannak, ami az alkalmazásoknál gyakran 
előfordul, 


AZ 1, U2,. . . , Un SOrOZat többféle módon adható meg. Kaphatjuk tömb, lán- 
colt lista formájában vagy egy külső táron levő állomány rekordjainak sorozata- 
ként. Legtöbbször a Vz, V2,. . . , Un sorozatot ugyanolyan formában követelik tő- 
lünk, mint amilyen a bemenet volt. Ezért a rendező módszerek átalakító lépései 
többnyire az elemek (tömbelem, listaelem, rekord) mozgatásai, cseréi. 


A rendezési feladat két szempontból fontos. Gyakran előfordul, hogy magában 
a kérdés megfogalmazásában szerepel a rendezés, Például, ha arra vagyunk kíván- 
csiak, hogy egy nyilvántartásban szereplő személyek közül kinek a legnagyobb a 
fizetése, vagy hogy kiknek a fizetése van az átlag fölött stb. A másik, talán még 
fontosabb alkalmazás a rendezés használata a keresés megkönnyítésére. Ezzel ké- 
sőbb behatóan foglalkozunk. Most csak egy példát említünk. A telefonkönyvhöz 
általában azért fordulunk, hogy (gyorsan) megtaláljunk egy telefonszámot, Nem 
érdekel bennünket különösebben a nevek rendezése, de a név szerinti rendezettség 
komoly segítséget nyújt a gyors keresésben (képzeljük el, mi lenne, ha a telefon- 
könyv bejegyzéseit csak úgy, össze-vissza vetnék papírra). 

A fejezet elején a rendezett halmazokban való kereséssel foglalkozunk. Utána 
áttekintjük a legfontosabb összehasonlítás alapú rendezéseket. Az ilyen módszerek 
a döntéseiket kizárólag az elemek közötti c relációra alapozzák. A kulcsmanipulá- 
ciós rendezések ezzel szemben használhatják az elemek (kulcsok) belső szerkeze- 
tének ismeretéből eredő előnyöket. Megismerünk két ilyen szemléletű eljárást is. 
Ezután bemutatunk egy gyors párhuzamos rendező módszert, végül pedig külső 
tárakon levő állományok rendezésével foglalkozunk. 
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2.1. — Keresés rendezett halmazban 


A rendezett halmazokban való keresési eljárások jelentős szerepet játszanak a leg- 
különfélébb adatkezelő rendszerekben. Érdemes tehát közelebbről is megismer- 
kedni velük. Tegyük fel, hogy adott az (U, c) rendezett halmaz véges 


Szára sp érd pet Céh 


részhalmaza. Az §-re úgy gondolhatunk, mint az V általunk tárolt elemeinek 
összességére. Adott ezenkívül a bemenet részeként egy s € U elem. A felada- 
tunk annak eldöntése, hogy $ € § teljesül-e, Igenlő válasz esetén általában az s 
elem 5-beli , helye" is érdekel bennünket, 

A feladatot összehasonlítások segítségével szeretnénk megoldani, Egy ilyen 
lépésben vesszük valamelyik sz-t (5-nek a rendezés szerinti i-edik elemét), és 
összehasonlítjuk az $ elemmel. Az eredmény lehet s — 8;, $; 2 $ vagy $ 5 sz. Az 
eredménytől függően további ilyen összehasonlításokat végzünk, egészen addig, 
amíg az (s € 5?) kérdést meg nem tudjuk válaszolni, A fontosabb módszerek a 
következők. 


Lineáris keresés 

Az s-et először az § halmaz legkisebb elemével, s1-gyel hasonlítjuk össze. Ha 
§ a 84, akkor végeztünk, megállapítva, hogy s nincs 9-ben, Ha $ —— s1, akkor 
sikerrel jártunk; az (s E 57) kérdésre a válasz igenlő. Ha pedig s 2 81, akkor 
továbbmegyünk, és az $2 elemet vetjük össze s-sel. Ennek a kimeneteleit az elő- 
zőhöz hasonlóan kezeljük. Vagy választ kapunk a keresőkérdésre, vagy folytatjuk 
83-mal. És így tovább. Addig lépkedünk előre az 81, $2, . . . , $4, . . . Sorozat mentén, 
amíg az (s € 5?) kérdés el nem dől. 

Mi mondható a módszer — összehasonlításokban mért — költségéről? A legked- 
vezőtlenebb esetben, amikor ís $ 2 sn, az 5 halmaz minden elemével hasonlítunk; 
ez [SI — n összehasonlítást jelent. Ennél a feladatnál szokás átlagos lépésszámról 
is beszélni. Ekkor azzal a feltevéssel élünk, hogy a keresett s elem egyenlő esélíyel 
lehet a (—oo, sr], (s1, 82], . . . , ($n-1, $n] és ($n, 00) intervallumok bármelyiké- 
ben. Itt (a, b) az U azon s elemeinek az összességét jelenti, melyekrea €8£ b 
ígaz. Hasonlóan, (—oo, b] az U halmaz b-nél nem nagyobb, (a, 00) pedig az a-nál 
nagyobb elemeinek halmaza, 

Ha s € (—o0, si], akkor ! összehasonlítást végzünk, ha pedig s € (87, 51.41] 
akkor i 4- 1-et (1 £ í € n). Az utolsó intervallum (sa, 00] elemeire a költség n 
összehasonlítás. A kapott n -- 1 szám átlaga 


1-424---4tn-ilrná4n  nín-41) is, ett et 
n-41 — Ant) nii 2 nát 
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A módszer átlagos költsége tehát (n/2) -- 1 összehasonlítás körül van. 


Bináris keresés 

Az eljárás az oszd meg és uralkodj elven alapul. A feladat megoldását sokkal ki- 
sebb hasonló feladatok megoldására egyszerűsítjük. Először az 5 halmaz középső 
elemével hasonlítjuk össze s-et. Ennek az s; élemnek az i sorszáma lehet k vagy 
k-41 han — 2k. Ha pedig n — 2k- 1, akkori — k 4 1. Mit ad az 5 és s; 
összevetése? Ha s — s;, akkor egyetlen lépésben végeztünk. Ha s € s;, akkor 
az s elemet elég már csak az (si, . . . , 5-1) részhalmazban keresni. Ugyanígy, 
has 5 84, akkor az (s;41, . . . , Sn ) részhalmazra szorítkozhatunk. Egyetlen jól 
irányzott kérdéssel tehát vagy megtaláljuk az 5 elemet, vagy pedig visszavezetjük 
a kérdést egy sokkal kisebb 51 rendezett halmazban való keresésre. Az 51 mérete 
legfeljebb az S méretének a fele: [S1] c ISI/2 — n/2. Az eljárást ismételjük, 
amúg ez a felezés Jehetséges. Az egyre zsugorodó célnalmazok legyenek 


$9— 5, S1... 54. 


Az utolsó S; halmazról feltehetjük, hogy nem üres, más szóval 1 S ]5S;]. továbbá, 
hogy az S; középső elemével való összehasonlítás már megválaszolja az (s € 5?) 
keresőkérdést. Eszerint a felhasznált összehasonlítások száma j -k 1. Az ISi4al £ 
1S;1/2 egyenlőtlenségek összefűzésével kapjuk, hogy 151 — n, ISil £ n/2, 152] £ 
n/4, . . . ISjl £ n/27. Az utolsó szerint 1 c 1/2?, amiből j S loga n. 

Összesen tehát j 1 £ log2 n 4-1 összehasonlító lépés elég, Picivel pontosabb 
aj41£ [l0gy(n 6 DJ] korlát. Ez j £ [log2 ni c logo(n 4 1) miatt érvényes. 


Feladat: Mutassuk meg, hogy a bináris keresés optimális: kevesebb összehasonlí- 
tással nem oldható meg a feladat. (Alkalmazzuk az ellenség-módszert. Az ellenség 
úgy válaszol az algoritmus kérdéseire, hogy utána s keresését a nagyobbik rész- 
halmazban ket folytatni.) 


A két módszert, a lineáris keresést és a bináris keresést egybevetve megállapít- 
hatjuk, hogy az utóbbi sokkal kevesebb összehasonlítást igényel. Mégsem mond- 
hatjuk, hogy a lineáris keresés rossz módszer. Ha ugyanis az 5 halmazt listaként 
vagy külső táras állomány részeként kapjuk, akkor a bináris keresés többnyire nem 
alkalmazható. A gond ott van, hogy ekkor nem tudunk elég gyorsan a halmaz kö- 
zepébe ugrani. A lineáris lépkedés pedig a legszerényebb szervezési módok mellett 
is megy. A tömbök fontos előnye, hogy alkalmasak a bináris keresésre. Általában 
a programozási környezet biztosítja, hogy az A[1 : n] tömb bármelyik A[í] eleme 
gyorsan elérhető. 

Az itt tárgyalt keresési feladatnak több értélmes változata van. Például az 5 
lehet egy rendezett sorozat, A különbség annyi, hogy ekkor az s; elemek között 
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ismétlődések is előfordulhatnak. A módszerek költségéről mondottak ekkor is ér- 
vényben maradnak, legalábbis ami a legrosszabb eseteket illeti. 

Egy másik érdekes változat, amikor a keresett s elem összes 5-beli előfordu- 
lását meg kell találnunk. A költség ekkor függ az ismétlődések számátói is. 


Példa: Tegyük fel, hogy az A[(1 : n] tömbben 








[ név [ cím ] telefonszám 








alakú bejegyzéseket tárolunk, a név szerint rendezve. A rendezettség annyit tesz, 
hogy hai a j, akkor az Alíi]-ben levő név mező értéke nem nagyobb, mint az 
Alj]-ben levőé. Ha mondjuk Rezeda Kázmér telefonszámára vagyunk kíváncsiak, 
akkor bináris keresést használhatunk. Az A tömb legfeljebb fiogaín -4- 1)7 ele- 
mének a megnézésével kiderül, hogy van-e információnk ilyen nevű személyről. 
Ha igen, akkor mindjárt kapunk is egy Rezeda Kázmérról szóló bejegyzést. Ha az 
összes Rezeda Kázmérra kíváncsiak vagyunk, akkor ettől a találati helytől jobbra. 
illetve balra lépkedve megtaláljuk valamennyit. Ez még körülbelül annyi tömbe- 
lem elérését jelenti, mint ahányszor ismétlődik a név. 


Megemlítünk még egy rendezett halmazban való keresési módszert. Ez az ún. in- 
telligens kereső rendszerekben fordul elő, használata elég bonyolult szervezést igé- 
nyel. A neve interpolációs keresés. Csak a módszer alapgondolatát szeretnénk itt 
érzékeltetni. Amikor a telefonkönyvben például Fátyol Szilvia számát keressük, 
akkor nem fogunk az elejétől kezdve lineárisan lépkedni. Nem próbálkozunk a 
telefonkönyv közepével sem, a bináris keresésnek megfelelően. A kötetet inkább 
valahol az első negyede táján nyítjuk ki, mert úgy érezzük, hogy az F-fel kezdődő 
nevek arrafelé vannak. Az F-betűs neveknél pedig nagy léptekkel igyekszünk meg- 
találni az elsőket, hiszen az á az abc elejéről való. 

Arról van itt szó, hogy információval rendelkezünk a tárolt halmaz elemeinek 
az eloszlásáról, aminek a segítségével jól-rosszul becsülni tudjuk a keresett elem 
lehetséges helyét. Az interpolációs keresők ilyen természetű ismeretek felhasz- 
nálásáva! próbálják gyorsítani a keresést. Áz információ minőségétől függően az 
összehasonlítások száma akár log log n-re is levihető. 


2.2. Összehasonlítás alapú rendező módszerek 


ht az olyan rendező eljárások legfontosabbjait érintjük, amelyek nem tekinthet- 
nek a rendezendő elemek ímásik szokásos szóhasználattal: kuicsok) belsejébe. Az 
elemekkel kapcsolatos döntéseiket csak és kizárólag a c relációra alapozhatják. 
Ezeket összehasonlítás alapú módszereknek nevezzük. Az eljárásokat tömbként 


30 2. RENDEZÉS 


megadott bemenetek esetére ismertetjük. Az olvasóra bízzuk annak meggondolá 
sát, hogy az elmondottak miként és mennyire maradnak érvényben más megadási 
módokra. A feladat ezek után a következő: 





Adott az (U, c) rendezett halmazból (típusból) való elemekből álló A[1 : n] tömb. 
Rendezzük át az A elemeit úgy, hogy azok a £ Szerint nem csökkenő sorrendben 
legyenek. 


A követelmény szerint az eljárás végén az A-nak ugyanazokat az elemeket 
kell tartalmaznia és ugyanakkora multiplicitással, mint kezdetben. A végállapot- 
ban érvényesek az A[(1] c A[2] S ... c Aln) egyenlőtlenségek. A módszerek 
költségének számításakor általában két tényezőt veszünk figyelembe: az összeha- 
sonlításokat és az elemek mozgatásait! , 


2.21. Buborék-rendezés 


A rendezésére egy kézenfekvő ötlet, hogy a rosszul álló szomszédos elempárokat 
megcseréljük: ha valamely i-re Ali] 2 A[í--1], akkor a két cella tartalmát kicserél- 
jük. Ha már nincs ilyen értelemben rosszul álló pár, akkor A rendezett állapotban 
van. Az ötlet egy kulturált kivitelezése a buborék-rendezés. A tömb elejéről indulva 
a rosszul álló szomszédos elemeket cserélgetve eljutunk a tömb végéig. Ekkor a 
legnagyobb elemtek egyike) AÍn]-ben van. Utána ismételjük ezt az A(1 : n — 1] 
tömbre, majd az A[1 : n — 2] tömbre, stb. Végül A rendezett lesz. 


procedure buborék 
("az A[1 : n] tömböt nem csökkenően rendezi ?) 
for(j—n—L1j50j:—j—1)do 
for(i—1,i£ji:sí41)do 
( ha A[i - 1] c Ali], akkor cseréljük ki őket.) 








A külső ciklus j változója vezérli az éppen aktuális A[1 : j 4 1] tömb méretét. 
A belső ciklusban pedig végigmegyünk ezen a résztömbön. Az elvégzett összeh: 
sonlítások száma ennek megfelelően n — 1, n — 2, . . . ,2, 1. Ez összesen 2 53 
összehasonlítást jelent minden bemenetre. A legrosszabb esetben ugyanennyi az 
elemcserék száma is. Ez akkor fordulhat elő, ha kezdetben a tömb fordítottan ren- 
dezett: A[1] 2 Af2] 2 ... 2 AÍn]. 











"Feltevésünkkel eJhanyagolunk néhány további költségtényezőt. Ilyen példáut a ciklusváltozók 
téptetésének az ideje. Ezek azonban nem befolyásolják az összköltség nagyságrendjét. 
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A módszer nevének magyarázatához képzeljük el, hogy a tömb függőle- 
ges helyzetben áll, Aln] van legfelüt és A[1] legatul. Képzeljük et még azt is, 
hogy a nagyobb elemek könnyebbek a kisebbeknél. A módszer alkalmazásakor 
a könnyebb elemek felfelé mozognak, mint a buborékok valami folyadékban. 

Az eljárás, mint később látni fogjuk, a versenytársainál sokkal több összeha- 
sonlítást használ, ha n nagy. A kódja viszont rövid, egyszerű, és könnyen átírható 
tömb helyett listával megadott bemenetre. Eme tulajdonságai miatt kis sorozatok 
(maximum 10-20 eleműek) rendezésére ajánlható. A módszer stabil (másik szoká- 
sos szóval: konzervatív ) abban az értelemben, hogy az egyforma elemek egymás 
közti sorrendjén nem változtat. 


2.2.2. Beszúrásos rendezés 


A módszer alapgondolata igen egyszerű. Tegyük fel, hogy az A(1 : k) résztömb 
már rendezett. Ezt használva rendezzük az A(1 : k -4- 1] résztömböt. Kezdetben, 
amikor is k — 1, a feltétel nyilván teljesül. Ezután sorra léptetve k-t rendezzük az 
AI : 2], A[1 : 3], . . .. A[1 : n — 1], A(1 : n] tömböket. Ezzel végül megoldjuk a 
feladatot. 

Hogyan jutunk k-ról k -- 1-re? Meg kell találnunk az A[k.-- 1] elem helyét az 
AI : k) rendezett résztömb elemei között. Ezt a beszúrásnak nevezett lépést egy 
példán keresztül mutatjuk be. Tegyük fel, hogy k — 4 és az Á[1 : 5] résztömb az 
alábbi: 








5[7T9T6 


Az A[1 : 4) résztömb már rendezett. Ebben megkeressük az utolsó elemnek 
- ami esetünkben 6 — a rendezett sorrend szerinti helyét. Ezt tehetjük lineáris vagy 
bináris kereséssel. A keresés eredményeként kiderül, hogy a 6 helye az A[2] és az 
A[3] elemek között van. A beszúrást úgy végezhetjük, hogy az A[3 : 4] résztömb 
elemeit eggyel jobbra toljuk, és a hatost az így szabaddá tett A[3]-ba mozgatjuk. 
Ezzel az A[1 : 5] résztömböt rendeztük: 


























Nézzük meg a módszer költségét! Ez bizonyos mértékig függ a beszúró lépés- 
ben alkalmazott keresési eljárástól. 


Beszúrásos rendezés lineáris kereséssel 
Ami az összehasonlítások számát illeti, a legkedvezőtlenebb esetet akkor kap- 
juk, amikor az A tömb már a bemeneti állapotában rendezett. A k -- 1-edik 
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elem beszúrásakor ebben az esetben k összehasonlítást használunk. Ezeket k — 
1,2,... ,n—1-re összeadva 2) összehasonlítás adódik. Könnyű meggondolni, 
hogy a cserék szempontjából a fordítottan rendezett tömb adja a legrosszabb ese- 
tet. A k 4 1-edik elem beillesztéséhez A[L : k 3- 1] mindegyik elemét mozgatni 
kell. Összesen ez En-1 mozgatást jelent. 


Vizsgálhatjuk a módszer átlagos viselkedését ís. Hogy ezt megtehessük, meg 
kell mondanunk, hogy milyen lehetséges bemenetekre számoljuk az átlagot. Nos, 
tegyük fel, hogy az átlagot a tömbnek az I, 2, . . . n — 1, n számokkal való összes 
lehetséges kitöltésére vesszük. Itt természetesen nincs jelentősége annak, hogy mik 
a tömbelemek, hiszen a módszer csak a c relációt használja. Mindössze az számít, 
hogy n különböző elem, és ezáltal n! lehetséges input sorrend van. 


Feladat: Tegyük fel, hogy AÍL1 : X) már rendezett, és az A(k 4- 1) elemmel még 
nem foglalkoztunk, Mutassuk meg, hogy a beszúrás során A(k-r 1] ugyanannyiszor 
eshet az első k elem által meghatározott k -- 1 intervallum bármelyikébe. (Legyen 
H az (1,2,...,n) egy k -- 1-elemű részhalmaza, és nézzük azokat az inputokat, 
amelyeknél az első k -- 1 elem pont a H-ból van. Ezek között mindegyik í € H 
ugyanannyiszor lesz a k -- 1. helyen.) 


A feladat szerint teljesül a feltétel, amit a lineáris keresés átlagos viselkedésé- 
nek elemzésekor megköveteltünk. Az összehasonlítások átlagos száma tehát a k- 
ról A 4 1-re lépésnél legalább § -- pég 2 §. Ezt összegezve (k — 1,2,....n- 1) 
kiderül, hogy az eljárás átlagosan legatább mr összehasonlítást végez. Lénye- 
gében ugyanezen érvelés mutatja, hogy a mozgatások átlagos száma is n?/4 körül 
van. 


Beszúrásos rendezés bináris kereséssel 
A már rendezett k elem közé a beszúrás flogo(k -t 1)] összehasonlítást igényel. 
Ezak — 1,...,n — 1 értékekre összesen 


(4) K :— flog2 2] 4-4 fogg] 
összehasonlítást jelent. Innen tetszőleges n-re K £ n[10g2 n]. A K költséget a (x) 
kifejezés alapján másként, valamivel pontosabban is becsülhetjük. Világos, hogy 
(log; k] c 1-4 1og2 k, amiből 

KCn-1--log22-4 --- 4 logan — n— 14 logo(n)). 


Most segítségül hívjuk a Stirling-formulát, ami a faktoriális-függvény növeke- 
dési rendjét fejezi ki elemi függvényekkel. A nevezetes formula következő alakját 
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használjuk: n! — (n/e)"V2rn. Logaritmusra térve 
$ 
log2 n! A n(log2 n — log; e) 4 5 logon 4 log; v2n £ nílog; n — 1, 442) 


adódik, feltéve, hogy n elég nagy. Azt is használtuk itt, hogy logje — 
1, 442695 . . ., és log? V2r z 1,32.... Kapjuk, hogy K c n(log; n — 0, 442 
elég nagy n-re. Az összehasonlítások száma sokkal kedvezőbb, mint a line: ke- 
resést használó változaté vagy a buborék-rendezésé. Rövidesen látni fogjuk, hogy 
ebből a szempontból a bináris keresést használó módszer közel optimális. 

Ha viszont a mozgatásokat is számításba vesszük, akkor ez a módszer sem 
bizonyul túl jónak. A mozgatások számát illetően a lineáris változatról mondottak 
itt is érvényesek, hiszen a mozgatások száma nem függ a keresési módszertől. A 
legrosszabb esetben eizjezü átlagosan pedig mintegy sz mozgatást végzünk. 





2.2.3. Egy alsó becslés 


Iu egy egyszerű, általános alsó becslést adunk rendező módszerek összehasonlítá- 
sainak számára. A korlát érvényes lesz minden összehasonlítás alapú eljárásra. 

Tegyük fel, hogy van egy rendező algoritmusunk, ami helyesen rendezi az 
(U, £) rendezett halmaz rögzített uz C u2 C ... a un elemének minden input 
permutációját. Ez azt jelenti, hogy az u; elemek mind az n! lehetséges bemeneti 
sorrendjét cserékkel átalakítja az úi, u2, . . . , tn sorrendre. Tegyük még fel, hogy 
a módszer kizárólag két kimenetelű döntéseken alapul. Ezen azt értjük, hogy felír- 
ható, mint 

if feltétel then akciói else akció? ; 


alakú utasítások egymásutánja. Itt akció; két dolgot jelenthet: egy másik utasításra 
való ugrást vagy pedig egy átrendezést. Az átrendezés az elemek akármilyen bo- 
nyolult csereberéje lehet. 

Tegyük fel, hogy a módszer legfeljebb k döntéssel megoldja a feladatot az 


1, 42, .. , , un elemek n! lehetséges bemeneti sorrendjének bármelyikére. Meg- 
mutatjuk, hogy ekkor 4 2 logoín!). 
Evégből nézzük a módszer működését a vj , V2, . . . , Un input sorozaton, és je- 


gyezzük fel sorban a kapott döntések eredményeit. Ezáltal egy legfeljebb k hosszú- 
ságú, igen, nem értékekből áltó sorozatot, kódszót kapunk. 

Azt állítjuk, hogy így különböző bemeneti sorozatokhoz különböző kódsza- 
vakat rendelünk. Legyen ugyanis vi, V2, - . . , Vn ÉS u, Wa, . . . , wn két bemenet, 
amelyekhez ugyanaz a válasz-sorozat tartozik. Ekkor ugyanaz lesz a végrehaj- 
tásra kerülő átrendezések Pj, P;, . . . , Ps, sorozata is. Végül mindkét esetben a 
rendezett ui, 2, . . . , un sorrendet kapjuk. A P; akciók invertálhatók, hiszen a 
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leképezés, amit megvalósítanak, kölcsönösen egyértelmű. Léteznek tehát a Bs 
, visszarendezések", Ezért ha a v4, v2, . . . , Un bemeneten a Pi, Pa, . . . , Ps, átren- 
dezések az uj, u2,..., un sorozathoz vezettek, akkor az utóbbíra alkalmazva 
a PB szt átrendezéseket visszakapjuk a vi, a, ..., Un SOTOZatot. 
Ugyanez elmondható a wi, 42, . . . , Un bemenetre is. A két bemenet tehát meg- 
egyezik. 

Ha egy bemenethez tartozó válaszsorozat k-nál rövidebb, akkor megfelelő 
számú igent a végére írva egészítsük ki k hosszúságúra. Ezután is igaz marad, 
hogy különböző bemenetekhez különböző kódszavak tartoznak. Ez azon múlik, 
hogy egy (eredeti értelemben vett) kódszó nem lehet egy másik folytatása. Ugyanis 
amíg a válaszok egyeznek, addig pontosan ugyanazokat az utasításokat hajtjuk 
végre mindkét esetben. Ha a két kódszó az első j válaszig egyezik, és az egyik 
bemenetnél a program végére értünk, akkor a másiknál ís ott leszünk. 

Az eddigieket összegezve arra jutottunk, hogy az n! lehetséges input mind- 
egyikéhez egy k hosszúságú kódszót rendeltünk, mégpedig különböző bemene- 
tekhez különböző kódszavakat. A kódszavak száma tehát legalább annyi, mint a 
bemenetek száma. A szóbajövő kódszavak száma 2", amiből 2" 2 n!, és végül 
k 2 logo(n!) adódik. Érvényes tehát a következő: 


Tétel: Tegyük fel, hogy egy pusztán két kimenetelű döntéseket használó program 
legfeljebb k itfyen döntés alapján rendezi n elem bármelyik bemeneti sorrendjét. 
Ekkor k 2 1ogo(n!) teljesül. O 








Példa: Az előző gondolatmenet illusztrálásaként vegyük a buüborék-rendezést az 
n — 3 esetben. A ciklusok kifejtése után a program így fest: 

if AJ2] c A[1) then A[2] 6 Ali]; 

if A[3] c A[2] then A[3] c A[2]; 

if A[2] c A[1] then A[2] 63 A[1]. 

Itt az Afi] € A[j] akció az Ali) és A[j]) tartalmának cseréjét jelenti. Tegyük 
fel, hogy az 1,2,3 számok permutációit rendezzük. A következő kis táblázat me: 
adja az egyes permutációkhoz tartozó kódszavakat. Látható, hogy hat különböző 
kódszót kaptunk. 




















Bemenet kódszó 
123 nem, nem, nem 
132 nem, igen, nem 
213 ] igen, nem, nem 
zat. nem, igen, igen 
312 igen, igen, nem 
321 igen, igen, igen 
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Az összehasonlítás alapú rendezések eleget tesznek az alsó becslésnél hasz- 
nált model! kikötésének. Ha az input sorozat (tömb, lista) elemei mind különbö- 
zők, akkor a c reláció tesztelésével tényleg két kimenetelű döntéseket használunk. 
Egyenlőség nem fog előfordulni. A ciklusokkal kapcsolatos tesztek nem érdeke- 
sek. Az előző példához hasonlóan adott n-re a ciklusok kiküszöbölhetők. Érvényes 
ezért az alábbi: 


Következmény: Egy összehasonlítás alapú rendező módszer n elem rendezésekor 
legalább logoín!) összehasonlítást használ. 


A beszúrásos rendezés jól megközelíti ezt a korlátot. Hátulütője viszont, hogy 
n?-tel arányos számú mozgatást igényel, és így az összköltsége nagy lesz. Ezután 
egy olyan módszert ismertetünk, ami a mozgatások számában is állja a versenyt, 


2.2.4. — Összefésüléses rendezés 


Két már rendezett sorozat (tömb, lista, stb.) tartalmának egy sorozatba való ren- 
dezése egyszerű feladatot jelent, Tegyük fel, hogy az A(L : k) valamint a BI : 7) 
tömbök rendezettek, és tartalmukat rendezetten tárolni akarjuk a C(1 : k 4-2) tömb- 
ben. A C[1]-be nyilván az A[1) és B[1] elemek közül a nem nagyobb kerül. Ha ez 
mondjuk A[1], akkor az A(2] és BÍ1)J egyike lesz Cf2]. Általában, ha az AÍfI1 : i) és 
B[1 : j] résztömböket már feldolgoztuk, tartalmuk nem csökkenően CI1 : í -- j]- 
ben van, akkor nyilván 


Oli j 1] :— minf Ali -- 1), B[j 4-1) 


a jó választás, Ezt az eljárást összefésülésnek nevezzük (jelölése: MERGE). Min- 
den egyes összehasonlítás után egy elem a helyére kerül, kivéve az utolsót, amivel 
két elem helyét d ki. A költség tehát k -- ( — 1 összehasonlítás és k -- ! moz- 
gatás. Az összefésülés igen hatékony eljárás, hiszen a bemenő adatok hosszával 
arányos időben, sőt lényegében egyetlen végigolvasással elrendezi a két soroza- 
tot. Hatékonysága miatt előszeretettel alkalmazzák a legváltozatosabb adatkezelő 
feladatokban. 

Ilyen alkalmazásnak számít az összefésüléses rendezés. Az összefésüléses ren- 
dezés alapötlete, hogy először rendezzük külön-külön az A[1 : n] tömb első felét 
És második felét, majd ezek tartalmát fésüljük össze. Itt ismét az oszd meg és ural- 
kodj elvvel találkozunk. Az AÍL : n) rendezésének a feladatát egy összefésülés árán 
visszavezetjük két feleakkora feladatra, az A(1 : [n/21]) és az A(fn/2] 41: n] 
résztömbök rendezésére. E résztömböket természetesen ugyanezen ötlettel kíván- 
juk rendezni. Mindezek a következő rekurzív definíciót sugallják (az eljárás neve 
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MSORT, paramétere a rendezendő tömb). Han 5 1, akkor 


MSORTK( AII : n]) :— 
MERGE(MSORT(A(1 : [n/2]]), MSORT(AI[n/2] - 1 : n])). 


Hogy elvarrjuk a rekurzió alját, legyen MSORT( A[É, i]) az üres utasítás. A 
módszer költségének elemzéséhez tegyük fel először, hogy n — 2. Legyen Tín) 
a felhasznált összehasonlítások maximális száma n-elemű bemenetekre. Figye- 
lembe véve az összefésülés költségét, a rekurzió szerint 


T(n) £n—1-42T(n/2), 


han 5 1. Ezt n/2-re alkalmazva és visszahelyettesítve 

T(n) £n-1-42(n/2—-1-427(n/4)) —n- 1-4 2(n/2 — 1) 4 4T(n/4). 
A felezést így folytatva végül 
T(n) £n-142(n/2—1) 4-4(n/4— 1). 426 (mj2! 1) £ nflogan]. 


Figyelembe vettük itt, hogy T(1) — 0. Az utolsó becsléshez elhagytuk a -I tago- 
kat, és használtuk, hogy k a legnagyobb egész, melyre n/24-! 5 1. (Természete- 
sen itt n választása miatt n/2" — 1 is teljesül, és ezért [log n] helyett egyszerűen 
loggn — k is írható.) 

Az elemzésnél tulajdonképpen a rekurzió mélysége szerinti fázisokba csopor- 

tosítva számláltuk össze az összefésüléseknél fellépő összehasonlításokat. Az első 
fázisban két n/2 méretű tömböt fésülünk össze, a következőben két-két 7/4 mére- 
tűt, stb. Összesen k fázis van. Egy fázisban az összefésülések legfeljebb 2n moz- 
gatással megvalósíthatók; ez összesen Znfiog2 n] mozgatás. A tárigény 2n cella: 
az összefésüléseket egy CII : n] segédtömbbe végezhetjük. majd az eredményt 
visszaírjuk A-ba. 
Megjegyzés: Az összefésülés megoldható helyben is: tegyük fel, hogy az 
AI(1 : 22] tömb Af1 : n] és AÍn 1 : 2n] részei rendezettek. Ekkor a két rész 
összefésülhető az A tömbbe O(n) összehasonlítással úgy, hogy A-n kívül még 
legfeljebb csak konstans számú cellát (pl. változókat) használunk. A módszerek 
azonban elég bonyolultak és nem praktikusak. 


Az összefésüléses rendezés költségére adott elemzésünknél feltettük, hogy n 
a 2 egy hatványa. Az általános esetben tetszőleges pozitív valós x-re legyen T(r) 
az [c] elem rendezésénél fellépő összehasonlítások maximális száma, Érvényes a 


T(x) c [r]—1--27T(x/2) 
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egyenlőtlenség. amiből a korábbihoz hasonlóan adódik T(n) £ n(loga n] tetsző- 
leges pozitív egész n-re. 

A programozástechnikában járatos olvasó tudja, hogy a rekurzív eljárások 
többnyire kevésbé hatékonyak, mint az íterációt használók. (Az érem másik oldala, 
hogy rekurzióval gyakran egyszerűbb, könnyebben olvasható leírást kapunk.) Az 
összefésüléses rendezést is érdemesebb iteratív formában megírni. Ekkor az első 
lépésben az A-ban szomszédos párokat rendezzük. Utána a szomszédos párok- 
ból rendezett négyeseket alakítunk ki összefésüléssel, majd ezekből nyolcasokat, 
stb. Erre a megoldásra is érvényesek a rekurzív változat költségéről mondottak: 
f1logz a] összetésülő fázisban legfeljebb n[10g2 n] összehasonlítást végzünk. 

Az összefésüléses rendezés költsége - mindkét költségtényezőt figyelembe 
véve — O(n log n). Ugyanakkor az alsó becslésünk szerint cn log n összehason- 
lítás szükséges ís. E két tényt összerakva megállapíthatjuk, hogy az összefésüléses 
rendezés konstans szorzó erejéig optímális módszer. 











2.2.5. A kupac adatszerkezet és a kupacos rendezés 


O brightening glance, 
How can we know the dancer from the dance? 
WILLIAM BUTLER YEATS 


A következő rendezési módszerhez először egy adatszerkezettel fogunk megis- 
merkedni. Adatszerkezeten bizonyos adat-fajták — típusok — és velük kapcsolatos 
funkciók, művelerek együttesét ük. Bizonyosan mindenki számára ismerős a 
lista adatszerkezet. Egyetlen típusból áll, amit elemnek nevezünk. A műveletek 
elemek véges halmazainak a kezelésére szolgálnak. Ilyenek például az első, meg- 
előző, következő elemeket megadó eljárások. 

A kupac adatszerkezettel egy (U/, €) rendezett halmaz (a kulcsok univerzuma) 
egy § véges részhalmazát szeretnénk tárolni. Két művelet tartozik a szerkezethez. 
Az egyik a beszúrás: U egy elemének hozzávétele 5-hez. A másik az § halmaz 
2 szerinti minimális elemének a törlése. Legyen ezen műveletek neve BESZÚR 
és MINTÖR. A kupac adatszerkezet tehát egy (U/, c) rendezett típus e két műve- 
lettel. Mire jó egy ilyen eljáráspár? A számos fontos alkalmazás közül itt hármat 
említünk. 




















1. Bizonyos (komolyabb) operációs rendszerekben a beérkező munkákhoz (jobok- 
hoz) prioritások rendelhetők. A rendszer mindig a legkisebb prioritási értékű mun- 
kát indítja el először. A még el nem kezdett munkákat egy kupacban tárolhatjuk. 
Az operációs rendszerhez érkező munkákat BESZÚR műveletekkel tesszük a ku- 
pacba. A következő indítandó munkát egy MINTÖR adja; ezzel a munka egyben 
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ki is kerül a kupacból. Ebből az alkalmazásból ered a kupac régebbi terminológia 
szerinti neve: prioritási sor (priority gueue). 

2. Több rendezett adatállomány összefésülése esetén célszerű lehet az egyes be- 
menő állományok legkisebb még feldolgozatlan elemeit egy kupacban tartani. A 
következő kiírandó elemet egy MINTÖR adja. 

3. Egy gyors és bűbájos rendező eljárás, a kupacos rendezés, amít itt bemutatunk. 


A kupac adatszerkezet egy hatékony ímplementációja: a bináris kupac 
Emlékeztetünk a bináris fa fogalmára. Ez egy olyan fa, amelynek csúcsai szin- 
teken helyezkednek el. A legfelső szinten egyetlen csúcs van, ezt gyökérnek ne- 
vezzük. Egy tetszőleges x csúcsból legfeljebb két él indul ki. Az élekhez irány 
tartozik (bal, jobb). Ezek eggyel alacsonyabb szinten levő csúcsokhoz vezetnek. 
A balra menő él végpontja az z bal fia, a jobbra menő él végpontja az z jobb fid. 
Egy a gyökértől különböző csúcsba pontosan egy él megy. Ennek megfelelően a 
gyökértől különböző csúcsoknak egyértelműen meghatározott apjuk van. Azokat 
a csúcsokat, amelyeknek nincs fiuk, leveleknek nevezzük. A nem-levél csúcsokat 
szokás belső csúcsoknak is nevezni. 

Bizonyos szép, telt bináris fák jól ábrázolhatók tömbben, pontosabban egy 
tömb tekinthető bináris fárrak a következők szerint: a fa csúcsai az A[L : n] tömb 
elemei. Az Al) csúcs bal fia A[2í), a jobb fia pedig A[2i -- 1]. Ebből adódóan ha 
j 5 1. akkor az A[j) csúcs apja A[1j/2]) lesz. 

Az ilyen alakban ábrázolható bináris fákat teljesnek nevezzük. A teljes fák 
levelei legfeljebb 2 szinten, a legalsón és esetleg a felette levőn helyezkednek el, 
és legfeljebb egy kivétellel minden belső csúcsuknak 2 fia van. 


A kupac elemeit egy tejjes bináris fában tároljuk. A fa csúcsaiban vannak a tá- 
rolni kívánt 5 halmaz elemei Egy csúcsban egy elem van; megeshet viszont, hogy 
egy s € § elem több csúcsban is előfordul. A fára teljesül a kupac-tulajdonság: 
egy tetszőleges csúcs eleme nem lehet nagyobb a fiaiban levő elemeknél. A követ- 
kező példában az elemek természetes számok (a szokásos rendezéssel). A tárolt S 
halmaz -— a többszörös elem jelenlétét is feltüntetve — (2, 4, 5, 6, 6, 8, 9). 





Ha a kupacnak (multiplicításokkal számolva) n eleme van, akkor a keretül 
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szolgáló teljes bináris fa egy n elemű tömbben tárolható. Az előző példának meg- 
felelő AL : 7] tömb így fest: 





f214]16]815]9]6] 























Nézzük meg ezután, hogy miként építhető kupac n elemből. Először az eleme- 
ket beletesszük az A(L : n] tömbbe, amit most teljes bináris fának is tekintünk. A 
sorrend egyelőre tetszőleges; mondjuk abban a sorrendben, ahogy olvassuk őket. 
Ezután gondoskodni kell a kupac-tulajdonságról. 

Az eljárás leírásához hasznosak lesznek a következő jelölések: legyen f egy 
részfa gyökere, jelölje a az itt tárolt elemet, az f fiai legyenek fi, fa, az elemek itt 
04, illetve a2. 

Tegyük fel, hogy a kupaccá alakítás útján már tartunk valahol: az fy és b 

gyökerű részfák már kupacok. Szeretnénk innen elérni, hogy az f gyökerű r. 
is teljesüljön a kupac-tulajdonság. Ezt hivatott biztosítani a felszivárog eljái 





felszivárog(f) 
( Ha min(a1, a2) c a. akkor min(ai , az) és a helyet cserél, 
Ha az a elem a;-vel cserélt helyet, akkor felszivárog( fi). ) 


A feltételek szerint a részfában a kupac-tulajdonság csak az f csúcsnál sé- 
tülhet. Ha ez a helyzet, akkor az elemcsere után a gyökérrel és a másik részfá- 
val már nem lehet baj. Elég az f; gyökei fát kupaccá tenni, Erre hivatott a 
felszivárog( f;) hívás, aminek szintén teljesülnek a feltételei. Valójában az törté- 
nik, hogy az a elem addíg megy lefelé a fában, amíg sérti a kupac-tulajdonságot. 
Tehát ha előbb nem, egy levélben bizonyosan nyugvópontra jut. Egy lefelé lépés 
költsége 2 összehasonlítás és egy csere. Ha a részfának / szintje van, akkor ez 
legfeljebb ? — 1 csere és 2(1 — 1) összehasonlítás. 

Legyen most f egy teljes bináris fa (gyökere), a fa csúcsaiban 5 elemeivel. A 
következő eljárás az egész fát kupaccá teszi. 








kupacépítés( f) 
( Az f fa v csúcsaira fentről felfelé, jobbról baíra felszívárogív). ) 


Vegyük észre, hogy a felszivárog hívásainát teljesülnek a hívási feltételek; amikor 
a felszivárog(v) hívás sorra kerül, akkor v fiait már rendbetettük. A hívási sorrend 
az A[L : n] tömbön nézve azt jelenti, hogy Afn] felől haladunk A[I] felé. 

A kupacépítés eljárás költsége: tegyük fel, hogy a fának n eleme és ? szintje van. 
(A gyökér az első szint.) Ekkor nyilván n £ 27 — 1. A fa teljessége miatt azt is 
tudjuk, hogy 24! £ n, amiből i £ logan 4 1. 


40 2. RENDEZÉS 


Az i-edik szinten levő csúcsok száma nem több, mint 271. Az i, szinten levő 
v csúcsra felszivárogív) költsége legfeljebb ? — í csere és legfeljebb 2(Z— i) össze- 
hasonlítás. A cserék száma ezért összesen legfeljebb Szt —áj2 1 Aj—1-i 
(azaz i — ! — j) helyettesítés után a cserék száma így becsülhető: 


€-t $-k 
FEJ IZE ÜZ EM 
370 4-0 


Csak az utolsó előtti egyenlőtlenség érdemel némi indoklást. A j/27 alakú 
tagok táblázatba foglalhatók, ahol egy tagnak egy sor felel meg: 


1/2 

1/4 1/4 

1/8 1/8 1/8 

1 1 3 B 8 


A táblázat oszlopainak összegei kisebbek mint 1, 1/2,...,1/27-!, ezek 
összege pedig kisebb mint.2. A szükséges cserék száma tehát legfeljebb 2n. Az 
összehasonlítások száma az előbbi összeg kétszeresével becsülhető; így nem le- 
het több, mint 4n. Összegezésül elmondhatjuk, hogy a kupacépítés eljárás lineáris 
költséggel megvalósítható. 


Nézzük ezután a kupacra jellemző alapműveleteket: 

A MINTÖR megvalósítás törlendő elem a kupac-tulajdonság miatt a fa f gyö- 
kerében van. Ezt kivesszük innen, majd f-be tesszük a fa utolsó szintjén a jobb 
szélső csúcsban levő elemet; az utóbbi csúcsot töröljük, majd felszivárog (f) kö- 
vetkezik. Az összköltség O(!) — O(log n). Az Afi : a) tömbön szemlélve mind- 
ezt: a hívás az AÍ1]) elemet adja vissza, Alnj kerül Af1]-be, erre meghívjuk a fel- 
szivárog eljárást, majd a tömb méretét csökkentjük. Az új kupac Af1 : n — 1]-ben 
lesz. 

BESZÚR(s5) megvalósítása: új levelet adunk a fához (ügyelve a teljességre). Ebbe 
a levélbe tesszük az s elemet. Ezután s-et mozgatjuk felfelé, amíg az őt tartalmazó 
csúcs apjában levő 5! elemre igaz, hogy s — 57. Az összköltség 0(4) — O(logn). 
Mit jelent ez tömbös ábrázolásban? Az Af1 : nj tömbhöz új elemet veszünk. Az 
Aln - 1]-be tesszük az s elemet, ami innen kezdi meg felfelé vándorlását. 





A kupac adatszerkezet itt leírt implementációját, a bináris kupacot szokás egy- 
szerűen csak kupacnak nevezni. Az irodalomban gyakran előfordul, hogy a ter- 
minológia nem téesz különbséget a szerkezet és annak valamelyik megvalósítása 
között. 
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Bizonyos alkalmazásokban hasznos a FOGYASZT eljárás. Ennek célja egy a 
kupacban levő elém , kulcsának csökkentése"; pontosabban fogalmazva kisebbel 
való helyettesítése. Két bemenő paramétere van; az egyik a szerkezet egy s eleme, 
a másik az U egy s-nél kisebb s" eleme. Az s-ről feltesszük, hogy ismerjük a 
kupacbeli helyét, tehát nem kell megkeresni. FOGYASZT-(s, s") az s helyére az 
s" a 8 elemet teszi, majd helyreállítja a kupac-tulajdonságot, Utóbbi a beszúrásnál 
látott módon az s" felfelé való mozgatásával érhető el. A művelet költsége ezért 
0(1) - O(logn). 


A kupacos rendezés 

A kupacos rendezés módszerét J, W. J. Williams és R. W. Floyd javasolták 1964- 
ben. Bemenete a rendezendő sorozatot tartalmazó A[1 : n] tömb. Először kupa- 
cot építünk, utána n darab MINTÖR adja nem csökkenő sorrendben az elemeket. 
Az összköltség az előzőek alapján O(n) 4- O(nlogn) — O(nlogn). A kupa- 
cos rendezés elméletileg a leggyorsabb ismert rendező módszer, Ez úgy értendő, 
hogy az összesített költségére ismert felső becslések a legjobbak a rendező eljá- 
rások korlátai közül. Gondos, pontos implementáció és becslés mellett a korlátok 
2nlloga n] 4 3n (összehasonlítások száma) és nIlogan] -- 2, 5n (cserék száma). 


A kupac egy általánosabb implementációja: d-kupacok 
A kupac adatszerkezet egy olyan implementációját ismertük meg, amelyben az 
elemeket tartalmazó alapstruktúra egy tömbben ábrázolt bináris fa. Pontosab- 
ban szólva az A[1 : n) tömb elemeit egy bináris fa csúcsainak tekintettük. 
Ez a szemlélet könnyen általánosítható, Legyen d 5 1 egy egész. Az A töm- 
bön egy olyan gyökeres fa-struktúrát definiálunk, amelyben egy csúcsnak legfel- 
jebb d fia van. A fa gyökere legyen itt is A[1]. Az Ali) csúcs fiai legyenek az 
Ald(i — 1) 4 2], Ald(i — 2) -- 3], . . . Aldi - I] elemek, illetve ezek közül azok, 
amelyek indexe nem nagyobb, mint n. Ennek megfelelően i 5 1-re az Ali] csúcs 
apjának indexe [(i — 1)/d]. Nevezzük az így nyert fát teljes d-fának. Egyszerűen 
meggyőződhetünk róla, hogy a d — 2 esetben éppen a teljes bináris fákat kapjuk. 
Egy teljes d-fa levelei legfeljebb 2 szinten helyezkednek el, és legfeljebb egy kivé- 
tellel minden nem-levél csúcsának éppen d fia van. Ennek folyományaként ha a fa 
! szintből áll, akkor az első 1— 1 szinten 1-4d-4-d2 4. ..4dt-1 — (dd 1)/(d- 0) 
csúcs van. Innen d!/(d—-1) Sn,ésd alapú logaritmusra térve ! £ logan 4 L 

A kupac adatszerkezet d-kupac elnevezésű implementációjában az § elemeit 
égy teljes d-fa csúcsaiban helyezzük e! úgy, hogy teljesüljön a kupac-tulajdonság: 
égy csúcs eleme nem lehet nagyobb a fiaiban levő elemeknél. A korábbi imp- 
lementációra — amit immár 2-kupacnak is hívhatunk — megismert algoritmusok 
kézenfekvően általánosíthatók d-kupacokra. 
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Feladat: Mutassuk meg, hogy egy n elemű d-kupac esetén az alapeljárások meg- 
valósíthatók az alábbi táblázatban foglalt költségkorláton belül. Az f egy olyan 
csúcsot jelöl, amelynek a részfája k szintből áll: 


Műveletigény 

Oídk) 

O0(n) 

O(dlogyn) 

LBESZÜR O(ogyn) 
FOGYASZT ] O(logyn) 





























(A módszerek a d — 2 esetre látottak kézenfekvő általánosításai. A kupacépí- 
tés elemzéséhez hasznos, hogy a fa í-edik szintjén legfeljebb dí7! csúcs van, és 
Dizoild S Dig i/2 s 2) 


2.2.6. . Gyorsrendezés 


A módszert C. A. R. Hoare találta 1960-ban. Az alapötlet ismét egy szép példa az 
oszd meg és uralkodj elv alkalmazására. A rendezendő AfI : n] tömb egy véletlen 
§ elemét vesszük. Ezután a tömb elejébe mozgatjuk az s-nél kisebb elemeket, a 
végébe az s-nél nagyobbakat. A kettő között helyezkednek el az s előfordulásai. 
Nevezzük PARTÍCIÓnak az eljárást, ami ezt megvalósítja. A PARTÍCIÓ(s) tehát 
felbontja három részre az A tömböt. Az AÍL : k) résztömb elemei s-nél kisebbek, 
Alk 4-1 : (1) minden eleme s, végül A(Z 4 1 : n] elemei s-nél nagyobbak. A 
PARTÍCIÓ(s) hívás utáni helyzet így szemléltethető: 











s-nél kisebb elemek ! s Tf ... ) 8 ! s-nél nagyobb elemek 











Világos, hogy eztán már elegendő az első és utolsó résztömböt rendezni. A 
GYORSREND eljárás vázlata következik. 


GYORSRENDÚ A[1 : n)) 

1. Válasszunk egy véletlen s elemet az A tömbből. 

2. PARTÍCIÓ(5); az eredmény legyen az A[I1 : k), Alk 1 : 2], AI 41 : n) 
felbontás, 

3. GYORSREND(A[I : k]); GYORSREND( AL -t 1 : n]). 





A GYORSREND-algoritmus lelke a partícionáló eljárás. Érdemes ezért jobban 
szemügyre venni. Tegyük fel, hogy az A(1 : n] tömbbel és az s elemmel dolgo- 
Zunk. Az i és j változók értéke kezdetben 1, illetve n. Először i-t növeljük, amíg 
Ali) c s teljesül. Utána j-t csökkentjük, amíg A[j) 2 5. 
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i a 4— j 
[5-nél kisebb elemek s-nél nem kisebb elemek 

















Ha mindkettő megáll (nem lehet továbblépni), ési c j, akkor kicseréljük AK] 
és A[j] tartalmát. Ezután i :— 1-41ésj :— j— 1. Ha a két mutató összeér (már 
nem teljesül í C j), akkor s előfordulásait a felső rész elejére mozgatjuk. Innen 
világos, hogy PARTÍCIÓ(5) költsége 0(n). 

A GYORSREND eljárás futási ideje nagymértékben függ attól, hogy a partí- 
cionáló elem mekkora méretű részekre (mennyire egyenletesen) vágja szét a töm- 
böt. (Gondoljuk meg, mi történik, ha mindig a rendezés szerinti legkisebb elemet 
használjuk.) Itt van szerepe a véletlen választásnak. Ekkor nagy az esélye, hogy s 
eléggé egyenletes vágást biztosít. 





A gyorsrendezés várható költsége 

Az egyszerűség kedvéért feltesszük, hogy a rendezendő Af1 : n] tömb elemei az 
1,2,...,n számok. Jelölje Cín) az A rendezéséhez felhasznált összehasonlítá- 
sok várható számát. Ez a mennyiség ugyanaz lesz mind az n! lehetséges beme- 
neti sorrendre, hiszen az összehasonlítások száma csupán a partícionáló elemek 
választásától függ. Nyilván igaz, hogy C(0) — C(1) — 0. Legyen C(n,j) az 
összehasonlításokban mért várható költség abban az esetben, amikor a legelőször 
választott partícionáló elem éppen j. A módszer szerkezetéből látjuk, hogy 


C(nj)—-n-140(j—1) 4C(n— j). 


Az első tag a partícionálás összehasonlításaiból adódik, a következő kettő pedig az 
alsó, illetve a felső rész rendezéséhez használt összehasonlítások várható száma. 
A partícionáló elemek (egyenletes eloszlás szerinti) véletlen választása azt jelenti, 
hogy mindegyik j ugyanakkora eséllyel lesz az első partícionáló elem. Érvényes 
tehát a következő: 


C(n) — : (C(n,1) 4 C(n,2) 5-4 C(n.n- 1) 4 C(nn)). 
Innen az előző egyenleteket használva kiküszöbölhetjük a Cín, j) mennyiségeket: 
(4) Cfn-n-142(CM OJ 4 CN 1), 
amiből n-nel való szorzás után 
nC(n) — nín—-1) 4 2(0(1) 4 C(2) 3-4 0(n — 1))- 


A kapott kifejezés hátulütője, hogy túl sok C(i) alakú tag szerepel benne. Ezen 
segíthetünk, ha n helyett n — 1-re is felírjuk a formulát, majd ezt kivonjuk (-t-)-bólk: 


nC(n) — (n—1C(n— 1) —2(n—1) 420(n— 1). 
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Innen átrendezés és n(n -- 1)-gyel való osztás után a következő egyenlőséget nyer- 

jük: f4 

; Cín)  2(n-1 , Cín-1) 
n41  nínt1) n 

ami elég egyszerű szerkezetű rekurziót ad a C(n)/(n -- 1) mennyiségekre. Mivel 

csak felső korlátot akarunk, további egyszerűsítést érhetünk el a jobboldal első 

tagjának kis növelésével. A számlálóban n — 1 helyett n -- 1-et írva 


C(n) e 2 4 Cín- 1) 





. 





n41 n n 


Ezt ismételten önmagába helyettesítve végül azt nyerjük, hogy 


Cim 2.2 ...42,2,2 
n41 n n-l 3 2 1 
A jobboldal a nevezetes Ha — 1-4 1/24 1/3 4 -: 4 L/n harmonikus szám 
kétszerese. A H, számok nagyságrendjéről ismert, hogy Ha — Inn y- o(1), 
ahol y — 0.55721 . . . az Euler-állandó. Mindezeket összeolvasva azt kapjuk, hogy 


Cín) c nni 0(n) z 1,391log2n 4 O0(n). 


Itt használtuk, hogy Inn — (1n 2) loga n és In 2 0, 69. 

A módszer tehát várhatóan csak mintegy 39 százalékkal használ több összeha- 
sonlítást annál, amit az alsó korlát megkövetel. Valójában a gyorsrendezés a vár- 
bató futási időt tekintve az egyik leggyorsabb ismert módszer annak ellenére, hogy 
a legrosszabb esetben akár cn? is lehet a költsége. Gyakorlati viselkedése alapján 
a legjobbnak tartott összehasonlítás alapú módszer memóriában levő állományok 
(lista, tömb) rendezésére. 


2.2.7. A k-adik elem kiválasztása 


Tegyük fel, hogy adott az (U, c) rendezett típusból való elemek egy tr, 2, . . . , tn 
sorozata, és egy £ egész, (I £ k £ n). A feladat az, hogy határozzuk meg a 
sorozatnak a c rendezés szerinti k-adik legnagyobb elemét. 

A k — n eset a maximális elemíek egyikének) kiválasztását jelenti. Már a 
buborék-rendezés kapcsán láttuk, hogy ez megtehető n — 1 összehasonlítással. En- 
nél kevesebb általában nem elég. Ahhoz ugyanis, hogy a maximálistól különböző 
u elemről tényleg biztosan tudjuk, hogy nem maximális, szükség van egy olyan 
összehasonlításra, amelynél u kisebbnek bizonyul. A maximumtól különböző n—-i 
elem mindegyike legalább egyszer alulmaradt. Mivel egy ilyen mérkőzésnek leg- 
feljebb egy vesztese van, a mérkőzések száma legalább n — 1. Hasonló mondható 
ak — 1 esetről, a minimális elem kiválasztásáról. 
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A második legnagyobb elemet n 4 [1loga n] — 2 összehasonlítássai azonosít- 
hatjuk. Egy lehetséges módszer a sportból jól ismert kieséses verseny. Állítsuk az 
elemeket párokba, hasonlítsuk össze a párok tagjait, majd a győzi 
el ugyanígy. Végül foga n] fordulóban összesen n — I mérkőzés 
hogy ki a győztes. A második helyezett nyilván azok között van, akik csak a bajnok 
ellen vesztettek. Ilyen jelöltekből legfeljebb (log2 n] lehet; [10g2n] — 1 mérkő- 
zéssel eldönthető, hogy közülük ki a legjobb. Az is igaz, hogy n -- [1og2n] — 3 
összehasonlítás nem mindig elég. Ezt nem részletezzük. 

Általában elmondhatjuk, hogy O(nlogn) összehasonlítással tetszőleges k-ra 
célt érünk. Ekkora költséggel rendezhető az u; sorozat, ami után a k-adik elem 
könnyen meglelhető. 

Hak £ n/logn, akkor lineáris számú, azaz 0(n) összehasonlítás elég: épít- 
sünk kupacot az u; elemekből, majd hajtsunk végre k egymás utáni MINTÖR-t. 
A költség 0(n) - kOftogn) — O(n) - Of(n/ logny logn) — 0(n). Ugyanez 
érvényes, hak 2 n— n/logn. 








A kiválasztás feladata általában ís megoldható lineáris költséggel, Az ilyen 
módszerek azonban meglehetősen bonyolultak és csak nagy n értékekre tudnak 
versenyezni az egyszerűbbekkel, mint amilyen a teljes rendezésre építő eljárá 
Mindezek ellenére érdemes megismerkedni e módszerek boszorkányos redukciós 
ötletével. 

Tegyük fel tehát, hogy a k-adik elemet akarjuk kiválasztani. Jelölje Tín) az 
ismertetésre kerülő módszer összehasonlításainak maximális számát n elem és tet- 
szőleges k mellett. Az egyszerűség kedvéért feltesszük még, hogy az u; elemek 
mind különbözők. Olyan elemet igyekszünk találni - nevezzük ezt polgárnak —. 
ami mindkét szélsőségtől távol van abban az értelemben, hogy legalább n/4 elem 
kisebb nála, és legalább n/4 elem nagyobb nála. Ha van egy ilyen elemünk, akkor 
n — 1 összehasonlítással megkaphatjuk a nál: kisebb elemek §1 és a nála nagyobb 
elemek S2 halmazát. Ha k c 151], akkor ezután elég 51 k-adik elemét megtalálni. 
ha pedig k 5 [91] 1, akkor S2-nek a k — 151] — 1-edik eleme lesz az új célpont. 
Mindkét esetben kevesebb, mint 32/4 elem közül kell választani, Egy polgár se- 
gítségével tehát dc$ámai módon csökkenthető a feladat mérete. A gondolatmenetből 
a T(n) függvényre az alábbi egyenlőtlenség következik: 














Tínj)£n-1- a polgár költsége 4 T(3n/4). 


Világos innen, hogy akkor kapunk erős korlátot T(n)-re, ha gyorsan tudunk pol- 
gárt találni. Ezt pedig a következőképpen tesszük: 

1. Az n elemet ötös csoportokba soroljuk, elhagyva a végén keletkező 0-4-elemű 
csoportocskát. Összesen [n/5] ilyen csoportunk lesz. 
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2. Minden ötös csoportnak meghatározzuk a rendezés szerinti középső elemét; ez 
csoportonként legfeljebb 6 összehasonlítás, összesen nem több, mint 6/n/5]. 

3. Az előbb meghatározott [n/5] elem közül kiválasztjuk a középsőt. Legyen ez a 
polgár. Ez az LEJÉJ-edik elemet jelenti. A választást az éppen tárgyalt kiválasztó 
algoritmussai végezzük. Ha úgy tetszik, itt egy rekurzív hívás történt. 

A polgár nem kisebb az n elem közül 31 ő ]-nél. Ugyanis nem kisebb, mint 
Lé] középső elem, amelyek nagyobbak a csoportjukban még további két-két 
elemnél. Egyszerű számolás mutatja, hogy han 2 25, akkor 30881 5 n/4. 
Eszerint a választott elemünk nagyobb legalább n/4 elemnél. Hasonló érveléssel 
kapjuk, hogy han 2 25, akkor a polgár kisebb legalább n/4 elemnél. Tényleg 
rászolgál tehát a polgár névre. Ha n £ 24, akkor a k-adik elemet közvetlenül (pol- 
gár választása nélkül) megkaphatjuk. Ez — összefésüléses rendezéssel — legfeljebb 
n[(10ga n] £ 5n összehasonlítás. 

Mibe kerül a polgárválasztás? A második lépés költsége legfeljebb 6n/5 
összehasonlítás, a harmadiké legfeljebb T(n/5). A T(n)-re nyert egyenlőtlenség 
ezekkel az adatokkal így alakul: 


[d 
5n han c 24 
Tas ( 11n/5 4 T(n/5) 4 T(8n/4) han 5 24. 


Innen egyszerű indukcióval következik, hogy T(n) £ 44n. Ez nyilván igaz, 
ha n £ 24. Nagyobb n-ekre az indukciós feltevést használva 


T(n) £ 1In/5 £ T(n/5) 4 T(3n/4) £ 11n/5 -4 44n/5 4- 44 : 3n/4 — 
 44m/20 -- 4 - 44n/20 -- 15 - 44n/20 — 20 : 44n/20 — 44n. 


Pontosabb és egyszersmind bonyolultabb becsléssel a korlát 7n-re levihető. 
Ezt nem részletezzük. 


2.3.  Kulcsmanipulációs rendezések 


Az eddig tárgyalt módszerek igen keveset tételeztek fel az (U, €) rendezett típus- 
ról (univerzumról), amihez a rendezendő elemek tartoznak. Kizárólag s € s" alakú 
összehasonlítások eredményei alapján oldották meg a feladatot. Gyakran a C relá- 
ción kívül sok mást is tudunk U-ról, Ismerhetjük például az elemei számát, vagy 
az elemek (kulcsok) belső szerkezetét. Ilyen ismeretekre építve az eddigieknél ha- 
tékonyabb rendezési módszereket adhatunk. 
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2.3.1. Ládarendezés (binsort) 


Arról az eljárásról lesz itt szó, amit feltehetőleg Jim használt a Kincses Szige- 
ten, amikor a sokféle érmét szortírozta. A módszer akkor hasznos, ha a lehetséges 
elemek U tartománya n-hez, a rendezendő elemek számához képest nem túl nagy. 
Tegyük fel, hogy az A[1 : n] tömböt szeretnénk rendezni, és tudjuk, hogy A elemei 
az m elemű U univerzumból kerülnek ki. Ekkor lefoglalhatunk egy UV elemeivel 
indexelt B tömböt (UJ egy rendezett típus!). Ennek elemei - a ládák - €/-beli ele- 
mek listái lesznek. Kezdetben minden lista (láda) üres. Az eljárás első fázisában 
végigolvassuk az A tömböt, és az s — Alt) elemet a B(5] lista végére fűzzük. A 
második fázisban az elejétől a végéig növő sorrendben végigmegyünk B-n, és a 
BIG) listák tartalmát visszaírjuk A-ba, 

Az eljárás költsége 0(n 4 m) elemi lépés. Létrehozzuk az üres líistákból áltó 
B tömböt. Erre O(m) költséget számíthatunk. Az első fázis, A végigolvasása és az 
elemeinek listákba illesztése 0(n) elemi lépést jelent. Végül a második fázisban a 
listák olvasása és az elemek visszatevése A-ba további O(m -- n) elemi lépéssel 
megtehető. 

Eszerint, ha az U kulcstartomány n-hez képest lineáris méretű (másként 
mondva: m £ en teljesül egy c állandóval), akkor ládarendezéssel O(n) költség- 
gel, azaz lineáris időben tudunk rendezni, Ez kedvezőbb, mint amit összehasonlítás 
alapú módszerekkel elérhetünk. Javasoljuk az olvasónak: gondolja meg, miért nem 
érvényes itt az összehasonlító módszerekre adott alsó becslés. 


Példa: Tegyük fel, hogy a rendezendő A[£ : 7] tömb elemei 0 és 9 közötti egészek: 








P.S SAN EEAEAENK 























Ekkor egy tízelemű B[0 : 9] tömböt lesz célszerű használni. Az első fázis után 
B így képzelhető el; 

















B:TTi 3 55]66 Ej 























A B[0], B(2], BI4). B[7], BÍ8] listák üresek, hiszen A-ban nem fordulnak elő a 
0, 2, 4, 7, 8 értékek. A B[5] és B[6] listák pedig kételeműek. mert az 5 és a 6 
kétszer szerepelnek A-ban. Ebben az esetben valamivel egyszerűbben is eljárhat- 
tunk volna. A B elemei lista helyett lehettek volna egész típusúak. A Bit ekkor 
számlálóként használjuk: B[j] a j kulcs A-beli előfordulásainak a száma. Az első 
fázis utáni helyzet így nézne ki: 
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A rendezése pusztán e számok ismeretében is elvégezhető, Listákra akkor van 
szükségünk, ha a rendezés alapját jelentő kulcsok mellett még más információk is 
vannak az Ali] elemekben; például a kulcs csak egy mező valamely rekord típusú 
elemben, Rendezéskor a többi mezőt ís mozgatni kell, 


Feladat: A ládarendezés érdekes speciális esete, amikor m — n, más szóval a 
rendezendő elemek és a lehetséges kulcsok száma egyenlő. Mutassuk meg, hogy a 
rendezés megoldható O(n) költséggel helyben is, vagyis az A tömb mellett még 
legfeljebb állandó számú további tárcella felhasználásával. 


2.3.2. Radix rendezés 


Tegyük fel, hogy a rendezendő kulcsok összetettek, több komponensből állnak, 
és a c reláció a komponensek rendezéséből származó lexikografikus rendezés. 
Legyenek mondjuk az U elemei k hosszúságú t1...tx alakú szavak, ahol a t; 
komponens az L; rendezett típusból való. Tegyük fel még, hagy az L; típusnak 
összesen s; eleme van. Legyen ti . , . tk ÉS 1 . . . u két kulcs U-ból. A lexikogra- 
fikus (szótárszerű) rendezés definíciója szerint t1...tk 2 Wi... tk éppen akkor 
teljesül, ha t; 2 u; a legkisebb í indexre, amelyre t; § ui. 


Példa: Legyen (U, c) a huszadik századi dátumok összessége az időrendnek meg- 
felelő rendezéssel. U természetes módon tekinthető három komponensből álló 
összetett típusnak. Az első az évszámokból álló típus: 


L4 — (1900, 1901,..., 1999), — si — 100. 
A második a hónapokat magába foglaló típus: 
La — (január február. . ., december), 52 7 12. 
A harmadik összetevőt a hónapok napjai adják: 
Ess (1,2,...,31), $355-381 


A dátumok rendezése éppen az L; típusokból származó lexikografikus rendezés 
lesz. 


A radix rendezés ilyen értelemben összetett kulcsok sorozatainak a rendezé- 
sére szolgál. A receptje lefegyverzően egyszerű: először rendezzük a sorozatot az 
utolsó, a k-adik komponensek szerint ládarendezéssel. Utána az eredményül ka- 
pott sorozatot ládarendezzük a k — 1-edik komponens szerint, és így tovább, végül 
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az első komponens szerint. Arra kell ügyelni, hogy az elemeket mindig a ládájukat 
jelentő lista végére rakjuk. Más szóval, ha a j-edik ládarendezés előtt az X kulcs 
előbb van a sorozatban, mint az Y kulcs, és a kulcsok k — j 4-1-edik komponensei 
egyenlők, akkor X megelőzi Y-t a j-edik menet után is. 

Az eljárás helyességét elég ak — 2 esetben vizsgálni; az érvelés könnyen 
általánosítható. Legyen X — ryz2ésY — yiy2 két kulcs, és tegyük fel, hogy 
X ca Y. Azt kell igazolni, hogy a végső sorozatban X előbb áll, mint Y. Ezt az 
utolsó, a második rendezés biztosítja, ha zi C yi. Hari — yi, akkor X c Y miatt 
szükségképpen x2 C y2. Ekkor az első menet után X megelőzi Y-t. A kiegészítő 
szabályunk szerint ezen a viszonyon a második menet sem változtat; X a végső 
sorrendben is Y előtt lesz. 


Példa: Nézzük a módszer működését a következő - dátum típusú — A(L : 5] tömbre 
mint bemenetre: 
1969. jan. 18. 


1969. jan. 1. ) 1955. dec. 18. 





. ] 1918. dec. 18. 


Itt k — 3. Az első fázisban a napok, utána a hónapok, végül az évek szerint 
rendezünk. Az egyes menetek utáni helyzeteket mutatja az alábbi ábra. 











1969. jan. 1. T 1969. jan. 18. T 1955. dec. 18. T 1955. jan. 18. T 1978. dec. 18. 














(1569. jan. 1. 1 1969. jan. T8. T 1955- jan. 18. 1 1955. dec. 18. ] 1918. dec. 18. 











(1918. dec. 18. 1 1955. jan. 18. ] 1955. dec. 18. 1969. jan. 1. [ 1969. jan. 18. 








A radix rendezés költsége a k ládarendezés költségének az összege. A ládaren- 
dezésről mondottak szerint ez 0(kn -4- JT 83) elemi műveletet jelent. Ez bizo- 
nyos esetekben ismét jobbat adhat az összehasonlító módszerek idejénél. Nézzünk 
néhány példát. 

Példák: 

1. Tegyük fel, hogy k - állandó és s; £ en (e 5 0 egy konstans). Ekkor a költség 
O(kn 3 Fr €n) - O(k(c 4 1)n) — O(n). Ilyen helyzet például, amikor az 
ÚnA 1] intervallumból való egészeket akarunk rendezni. Ezeket az egészeket 
k-jegyű számoknak vehetjük az n alapú számrendszerben. Az így felírt számok 
Sorozatainak rendezésére a radix-módszer lineáris költségű megoldást ad. 

2.k z logn, s; — 2. Ez a felállás, amikor log n hosszúságú bitsorozatokat rende- 
zünk. Ekkor a radix rendezés költsége O(nlogn 4 21logn) — O(nlogn). 
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2.4. A Batcher-féle páros-páratlan összefésülés 


Itt egy hatékony párhuzamos rendező algoritmust ismertetünk. A módszer az 
összefésüléses rendezés egy változata. Az abban szereplő összefésülő eljárást cse- 
réljük ki egy gyors párhuzamos megoldással. 

Az összefésülő módszert a jelölés egyszerűsi törekedve sorozatokkal 
mondjuk el. Legyenek A — az € ... c apés B — bi € ... c bm az input 
sorozatok. Célunk ezek összefésülése egyetlen növekvő C — cz € ... Ta Elrm 
sorozattá. 

A feladatot két egymástól függetlenül és párhuzamosan végezhető részre bont- 
juk. Az első brigád összefésüli az ai € az € az € ... és b; c by C b, — ... 
sorozatokat az uz a uz Z uz a . . . sorozattá. A második brigád összefésüli a két 
megmaradó részt, az az c ay c ag € ...ésbi c bz c bz € . . . sorozatokat 
avi € vz a vz a . . . sorozatba. Ezzel látszólag ugyanott vagyunk, ahonnan el- 
indultunk. Van két növekvő sorozatunk, az (uj) és a ív; b, amiket össze kellene 
fésülni. A következő állítás azt mondja, hogy a látszat csal. Az utóbbi két sorozat 
párhuzamosan egyetlen lépésben összefésülhető. A végeredményt jelentő sorozat 
cj eleme egy összehasonlítással megkapható. 














ÁMítás: Érvényesek a €2i-i — min(u;, vi) és csi — max(us, vi) egyenlőségek 
A ci£(14m)/2). 


Bizonyítás: Először azt látjuk be, hogy tetszőleges 1 £ k £ (I 4 m)/2 egészre 
AC 7 C1, . . . , c2k tészsorozatban ugyanannyi u; van, mint v;. Ezt úgy is mond- 
hatjuk, hogy fer,... cop) — fe... ukj U (V1.....Ük). A C sorozat a nö- 
vekvő A és B sorozatok efésülése. Emiatt a C első 2k elemét az A soro- 
zat első néhány eleme és a B sorozat első néhány eleme adja. Legyen mondjuk 
C4 — (1... ag) U (bi, . . . .box-s). Ekkor a Ck-ba eső u; elemek közül fs/2] 
tartozik az A, és LE-s] tartozik a B sorozatba. Ugyanígy a v; elemek közül 15/2] 
tartozik az A, és [872] tartozik a B sorozatba. A Cr-ba kerülő u; elemek száma 
[5/21 4 I(2k — 5)/2], az ilyen v; elemeké pedig 15/2] -- [42k — 5)/2]. A kettő 
egyenlősége következik az egyszerű számolással igazolható 


[5/2164 L(2k — 5)/2] — 15/2] 4 [(2k — 5)/21 














azonosságból. 


Nézzük ezután az állítást. Az észrevétel szerint fei,...,Ceg-n) 7 
(ua... ti 1) U (vi... s vg-1) és fer... egy 7 (u... gy UJ (01... üg. 
Ezeket összevetve (c2s-1,cag) — (ui, vih. amiből az állítás c2s-: £ Ca; miatt 
nyilvánvaló, O 
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A fentiekben vázolt páros-páratlan feibontássai az összefésülés feladatát 
visszavezettük két párhuzamosan végezhető feleakkora méretű feladaira és ezen 
felül párhuzamosan állandó időben elvégezhető további munkára, a minf( us, vb 
és maxfu;, v;) elemek meghatározására. Ezzel egy rekurzív eljárást körvonalaz- 
tunk. A két brigád ugyanígy osztja tovább a problémát. Legyen az algoritmus neve 
PM. 

Tegyük fel, hogy az A és B sorozatok összhossza n, és van (n/2] processzo- 
runk. Valójában úgynevezett CE (compare-exchange) elemek ís megteszik. Egy 
CE elem két kulcsot összehasonlít, és ha kell, felcseréli őket. A PM eljárás 
összehasonlításokban mért párhuzamos költségének maximumát adott n-re jelölje 
Tp(n). A PM eljárás szerkezetéből rögvest adódik a Tp(n) S Tp(In/21)-4-1 egyen- 
lőtlenség. Az első tag a két félméretű részfeladat párhuzamos költségét, a második 
pedig az (ui) és (v;) sorozatok összefésülését könyveli. Ebből az összefésülé- 
ses rendezés elemzésénél alkalmazott visszahelyettesítős érveléssel adódik, hogy 
T(n) £ fogan]. 

A PM eljárást használhatjuk az összefésüléses rendezésben. A definíció így 
módosul: 


MSORT(A[I : n]) :— PM(MSORT(A(I : [n/21]), MSORT(A[fn/27 - 1 : n])). 


Jelölje tp(n) a módszer párhuzamos költségét n elemű bemenetre. A tömb 
alsó, illetve felső felének a rendezése párhuzamosan végezhető. Ezért t,(n) S 
tp([n/2]) — floga n1. A második tag a párhuzamos összefésülés ideje. Ezt ismét 
a visszahelyettesítő módszerrel fejthetjük ki: 


toín) S1424- 4 (floggn1 — 1) fogan] — [2622 r Di[losz e]. 


A Batcher-rendező párhuzamos költsége eszerint tpín) — 0 (log? n). 


2.5. Külső tárak tartalmának rendezése 


Az eddig tárgyalt rendező eljárások kapcsán haligatólagosan feltettük, hogy az 
adataink a számítások menete során végig egy nagy elérési sebességű belső me- 
móriában vannak. A feltételezés ott bújt meg az eddigi elemzésekben, hogy nem 
szenteltünk túl nagy figyelmet az adatok mozgatásához szükséges időnek. Bizo- 
nyos esetekben csak az összehasonlításokat számoltuk. Máskor figyeltük ugyan 
a cserék és más mozgatások idejét, de ezeket az összehasonlításokéval egyező 
Nagyságrendű tényezőként kezeltük. Ez a szemlélet jól működik a belső memó- 
riás számítások esetén. Az így nyert becslések megfelelnek a tényleges számítások 


52 2. RENDEZÉS 


időviszonyainak. Külső tárakon (mágneslemezek, dobok. szalagok) elhelyezkedő 
adatok kezelésére viszont a feltételezés általában nem alkalmazható. 

Egy belső memóriában levő szó elérése és olvasása legfeljebb néhány mikro- 
szekundumot jelent. A mágnestemezek elérési ideje viszont az ezredmásodperces 
nagyságrendben van, diszketteknél pedig a másodpercet is meghaladhatja. A külső 
tárak elérési ideje tehát több ezerszerese is lehet a belsőkének. Külső tárakon levő 
adatok kezelésénél ezért komoly figyelmet kell fordítanunk az adatelérés/mozgatás 
költségeire. 





A külső tárak másik fontos vonása, hogy egy írás/olvasás során nem csak egy 
szót mozgatunk, hanem egy nagyobb területet. Használható modellt kapunk az 
ilyen tárak működésére, ha úgy képzeljük, hogy az állományok az elérhetőség 
szempontjából folytonosan egymás után következő lapokon helyezkednek el. Egy 
lap egyetlen VO művelettel kezelhető (olvasható, írható) terület a táron. A szoká- 
sos lapméret 512 : k byte valamely kicsi k-val. A folytonosság bizonyos esetekben 
tényleges fizikai folytonosságot jelent, máskor pedig magasabb szintű (pl. az ope- 
rációs rendszer által biztosított) eljárások adnak módot a következő lap értelme- 
zésére, Egy lapon általában több rekord is elfér. A lapok! beolvasása, kiírása igen 
költséges a belső memóriában végzett elemi lépésekhez képest. Átlagos alkalma- 
zásoknál az VO műveletek időigénye a futási idő döntő része. Ezért a külső tárat 
jelentős mértékben használó programok esetén alapvető hatékonysági szempont a 
lapelérések számának minimatizátása. A korábban tárgyalt rendezési módszerek, 
ötletek általában nem adnak jó eredményt, ha a rendezendő adatok külső tárban 
vannak. Tulajdonképpen egyetlen kivétel az összefésüléses rendezés. 





2.51. . Összefésüléses rendezés külső tárakon 


A bevezetőben említetteknek megfelelően az algoritmusok értékeléséhez egyetlen 
költségtényezőként a fapelérések számát használjuk. A módszerek, amiket ismer- 
tetünk, működnek mágnesszalagok esetén is, mert az állományokat lapjaik sor- 
rendjében (szokásos szakkifejezéssel: szekvenciálisan) használjuk. Ez annyit tesz, 
hogy a bemeneti állományokat szekvenciálisan olvassuk, és így végezzük a kiírá- 
sokat is a kimeneti állományokba. 

A célunk egy a háttértáron levő n lapból álló állomány rendezése valamilyen 
adott kulcs szerint (pl. személyek adatait tartalmazó rekordoké a személyi szám 
szerint) 








Definíció: Egy állomány k szomszédos lapjából álló rész k hosszú futam, ha a re- 
kordok ebben a részben a kulcs szerint ínem csökkenően) rendezetten helyezkednek 
el. 
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Először alkalmas kis k mellett (ha más nem, k — 1 mindig lehetséges; k 
hosszúságú kezdőfutamokat hozunk létre; ezeket egyenletesen elhelyezzük az A 
és B állományokba. Ez többnyire úgy történik, hogy egyszer végigolvassuk a be- 
menő állományt. A memóriában k lapnyt futamokat alakítunk ki; amint egy futa- 
mot befejeztünk, azt kiírjuk az A és B áliományok egyikébe, Ennek a műveletnek 
a költsége 2n lapelérés. A futamok közül az utolsó esetleg k-nál kevesebb lapot 
tartalmaz. 

















k k k maradék 
( z a Gt 2] 
kupi 
futamok 


Ezután az A és B állományok elejéről indulva sorban összefésüljük a futamo- 
kat — mindig egyet A-ból és egyet B-ből véve — 2k hosszúakká; ezeket egyen- 
letesen elhelyezzük a C és D állományokba. Egy ilyen menet költsége 2n [DO 
művelet. Ezután C és D futamait fésüljük ugyanígy össze 4k hosszú futamokká 
A-ba és B-be. és így tovább. 














kk kk 2k o 2k A4k 
SZ SZ -r—— 

B LL D ll B 
kk kk 2k 0 2k ak 

A c A 


Mint a kezdeti helyzetnél, később is előfordulhat, hogy a menetben utoljára 
kapott futam rövidebb a többinél. Ha az í-edik összefésülő menet után még egynél 
több futam van, akkor ezek közül az első hossza legalább 27. Ez pedig csak addig 
lehetséges, amíg 2i c n teljesül. Ha a j-edik az utolsó menet, akkor a j — 1. me- 
net után még legalább két futam van, tehát 2-1! c n, amiből logaritmusra térve 
j £ fogan]. A szükséges menetek száma nem több, mint (logan]. Az összes 
lapelérések száma ennek megfelelően legfeljebb 2n(floga n] -—- 1). Ezt az algorit- 
must, illetve változatait, finomításait használják leggyakrabban külső rendezésre. 





Két gyorsítási lehetőség: 
1. Érdemes minél nagyobb kezdő futamokat létrehozni, más szóval nagy k érték- 
kel dolgozni. Az előbbi gondolatmenet pontosítható: ha X hosszúságú futamok- 
kal kezdjük a fésülést, akkor k27-! c n is teljesül, amiből a menetek számára 
ij S flogo(n/k)] adódik. 
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2. m-felé fésülés, ahol m 5 2. Ekkor minden menetben m input és m output ál- 
lományt használunk, és egyszerre m futamot fésülünk össze egyetlen futamba. 
Egy menet után a futamok mérete m-szereződik. A menetek száma legfeljebb 
3 — flogan] — [(ogan)/1ogz m]. Itt még további 2m-szeres gyorsítás ér- 
hető el, ha van 2m párhuzamosan használható adatcsatornánk (minden állomány- 
hoz egy). Ekkor ugyanis egy [DO művelet ídeje alatt olvashatunk egy-egy lapot az 
input-állományokból, és ugyanekkor írhatunk is egy-egy lapot a kimenő állomá- 
nyokba. Az m felé fésülésnél ügyelni kell arra, hogy m növekedtével a futamok 
összefésülésének költsége is nő. Egyre több idő kell, és egyre nagyobb területet 
használunk a belső memóriában. 





Kezdeti futamok létrehozása kupaccal 

Itt egy érdekes algoritmust ismertetünk, amivel átlagos értelemben viszonylag 
hosszú kezdőfutamokat lehet építeni. A futamok hossza változhat, így előfordul- 
hatnak rövid futamok is. 

A belső memóriában lefoglalunk egy területet, amin K kulcs elfér. Mint látni 
fogjuk, K értékét érdemes minél nagyobbnak választani. mA lefoglalt területen két 
— kulcsokat tartalmazó — kupacot üzemeltetünk. A két kupacban összesen legfel- 
jebb K kulcsot tartunk. Az egyik lesz az aktív kupac a, a másik az alvó kupac A. 
Az aktív kupacban tartjuk az éppen kiírandó futam kulcsait, az alvóban pedig a kö- 
vetkező futam kulcsait gyűjtjük. Kezdetben mindkettő üres. Először a-t feltöltjük 
a rendezendő állománybói K kulccsal, A pedig üres. 

Ezután amíg a nem üres, ismételjük a következő lépést. Az s zMINTÖR(a) 
kulcsú rekordot beírjuk az aktuális futamba. Ezután vesszük az input állomány kö- 
vetkező rekordját. Legyen ennek a kulcsa f. Hat £ s, akkor a rekord már nyilván 
nem tehető az aktuális futam végére, ezért t-t A-ba szúrjuk be. Hat 2 s, akkor a 
t kulcs az a-ba kerül, hiszen ekkor a rekord még elhelyezhető valahol később az 
aktuális futamban, Ha a kiürül, akkor a futam befejeződik. A két kupac szerepet 
cserél, A lesz aktív, és a megy aludni, Új futam kezdődik, amit A-ból töltünk az 
előzőek szerint. 

Megmutatható, hogy — rekordokban mérve — az átlagos futamhossz 2.K lesz, ha 
a kulcsok alkalmas értelemben egyenletesen érkeznek. Ennek a jelenségnek kissé 
regényes magyarázatát adja a következő hóeke modell (E.F. Moore 1961). Egy kör 
alakú pályán hóeke megy körbe. 


hóeke megy körbe 
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A hó egyenletesen hull a pályára, a hóeke az előtte levő hómagassággal for- 
dítottan arányos sebességgel halad. Megmutatható, hogy van a rendszernek stabil 
állapota, amihez a kezdő helyzetből konvergál. Ekkor minden pillanatban ugyanaz 
a P hőmennyiség van a pályán, a hóeke sebessége állandó és a hó magassága li- 
neárisan függ az ekétől vató (pálya mentén mért) távolságtól. Ebből következik, 
hogy egy körben a hóeke 2P hómennyiséget takarít el. 




















ő 


A modellben a hó játssza a kulcsok szerepét. Az aktív kupac az eke jelenlegi 
helyzetétől az induló helyzetig menő ív, a maradék az alvó kupac. Így az egy kör- 
ben eltakarított hó felel meg egy futamnak. 

Minél előbbre tart a hóeke a pályán - vagyis minél nagyobb az aktív kupac 
minimális eleme -, annál nagyobb az esélye, hogy egy érkező hópehely a hóeke 
elé, és nem mögé esik. Másként mondva: a következő kulcs egyre növekvő eséllyel 
kerül az alvó kupacba. 


Többfázisú (polifázisú) összefésülés 

Vannak olyan k-rétű összefésülő sémák, melyek csak k -t 1 állományt használnak. 
A k input állományt egyetlen kímenő állományba fésüljük. Ha valamelyik input 
állomány üres lesz, akkor megállunk, és ez veszi át az output állomány szerepét. 
Itt csak ak — 2 esetre vetünk egy rövid pilfantást. Ekkor 3 állományunk van, és 
minden fázisban kettő tartalmát fésüljük a harmadikra. 

Nézzünk először egy példát. Legyen a három állomány fi, fo, fs: Tegyük 
fel, hogy fi egy, fa pedig 5 ugyanolyan (mondjuk 1) hosszúságú futamból áll, f2 
üres. A következő táblázat szemlélteti a helyzetet. Az oszlopok adatai mutatják az 
összefésülő menetek utáni állapotot, az első oszlop a kezdő állapot. Egy bejegy- 
Zés első száma a futamok száma az állományban, a zárójelben levő érték pedig a 
futamhossz. 








n]lia 0 13) 0 16) € 
f2]5(1) 4(1) 36) 21 10 0 
s]09 12 0 44 0 


Érezhetően túl sok mozgatást végzünk. Nem szerencsés a rekordok eloszlása a 
két állományban. Megmutatható, hogy ez a módszer akkor lesz a leggyorsabb, ha a 
futamok száma a két input állományban két szomszédos Fibonacci. 
— emlékeztetőül — néhány hasznos tény a Fibonacci-számokról. 
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A Fibonacci-számokat a következő rekurzióval definiálhatjuk: 
Fo-0,F1-1, Fi — Fpr Fp.i,hai2 1. 


Hasznos az alábbi általános alak (indukcióval igazolható): 


F.zgg Ma (sőjj, 


Innen látjuk, hogy F, az Jz( Hzsjn számhoz legközelebbi egész. 
Legyen $ — 15 (az aranymetszés aránya). 
A $? — $ 4-1 egyenlőségből adódik n 2 2 esetén, hogy 








973 SE Set 











Ezután nézzük, miként alakul a futamok száma, ha a kezdő futamszámok Fi 
és F,. A tábtázatban most nem tüntetjük fel a futamok hosszát. 


filFn-i 0 9 Fh-2 Fn-s 
hi Mm HR B  F.-z 
fil 09 0 F-i R-s 0 


Kezdetben a futamok száma összesen N — Fh41. Ebből é7! c Nésn-1£ 
logy N — log2 N/logag A 1.441og2 N adódik. A szükséges menetek száma 
ezért legfeljebb 1.441og2 N -- 1. Ez valamivel rosszabb ugyan, mint a 4 állományt 
használó összefésülésé, de még mindig elég jó. 


3. 
Keresőfák 


Vagy találunk utat, vagy építünk egyet. 
HANNIBÁL 


Az egyik legalapvetőbb adatkezelési igény, hogy adatok véges halmazait hatéko- 
nyan tárolni tudjuk. Hatékonyságon elsősorban az értendő, hogy a keresés, be- 
illesztés, törlés és módosítás műveletei gyorsak legyenek. Ebben a fejezetben a 
problémának azzal a fontos speciális esetével foglatkozunk, amikor a tárolt § hal- 
maz elemei egy (U, €) rendezett típusból valók. Ebben az esetben további termé- 
szetes igények is felmerülnek: érdekelhet bennünket az S legkisebb vagy éppen 
legnagyobb eleme, esetleg az §5-nek az [a, b) intervallumba eső elemei (a, b € U). 

Az így körvonalazott feladatcsokornak megfelelő adatszerkezet a keresőfa, 
amihez egyetlen (U, c) rendezett típus tartozik. A szerkezet célja az U egy vé- 
ges 5 részhalmazát tárolni úgy, hogy BESZÚR, TÖRÖL, KERES, MIN, MAX, 
TÓLIG hatékonyak legyenek. 

Ebben a megközelítésben jelentős egyszerűsítés van. A legtöbb esetben a tá- 
rolni kívánt adataink összetett szerkezetűek, több különböző típusú információ- 
elemből állnak. Ezek közül általában egy vagy csak néhány adja a keresés/tárolás 
alapját jelentő kulcsot. A terítékre kerülő algoritmusok szempontjából azonban 
eléggé közömbös, hogy a kulcs mellett vannak-e még további adatmezők is. A 
legtöbb esetben mit sem vesztünk azzal, ha feltesszük, hogy csupán U bizonyos 
elemeit kell tárotnunk. Ezzel az egyszerűsítéssel lehetővé válik, hogy csak az al- 
goritmikus szempontból lényeges tényezőkre figyeljünk. 

A műveletek pontos értelmezésében — elsősorban a kivételek kezelésénél — 
többféle változattal találkozhatunk. Ezeket nem célunk itt áttekinteni; csak a mű- 
veletekhez kapcsolódó jellegzetes teendőkről ejtünk szót. 

A BESZÚRÍÁz, S) eljárásíhívás) beilleszti az a € U elemet a tárolt 5 hal- 
mazba. TÖRÖL(z, 5) hatására x kikerül az § halmazból. KERES(z, S) megadja 
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az x elem helyét az §-ben, feltéve, hogy z € 5. MIN(S) megadja az §-nek a c 
rendezés szerinti legkisebb. MAX(5) pedig a legnagyobb elemét. Az intervaltum- 
keresésnek az 5 halmaz mellett van még két paramétere. Ezek az U elemei; jelöl- 
jük őket a-val és b-vel. TÓLIG(a, b, 5) eredménye azon s € 5 elemek összessége, 
melyekre teljesül hogya £ s £ b. 

Az adatszerkezet nevében a fa szó arra hivatott utalni, hogy a legjobb ismert 
implementációk fákra épülnek, faszerű struktúrákat használnak. Mielőtt ezekből a 
megoldásokból ismertetnénk egy csokorra valót, egy kís kitérőt teszünk, rögzítve 
néhány bináris fákra vonatkozó tényt. 





3.1. Bináris fák 


Bináris fákkal már találkoztunk az előző fejezetben a kupac adatszerkezet kapcsán. 
Ott érintettük egy tárolási módjukat is, ami csak bizonyos speciális, terebélyes 
fákra működik. Itt egy általánosan használható megadási módot szeretnénk bemu- 
tatni. Ebben a fa egy csúcsa összetett szerkezetű; úgy gondolhatunk rá, mint egy 
rekord-típusú objektumra mondjuk a Pascal nyelvből. A4 x csúcs fontosabb össze- 
tevői, , mezői" a következők: elem(z) az x csúcsban tárolt érdemi információ; ez 
a későbbiekben legtöbbször egy U-beli kulcs lesz. A bal(xr) mező egy mutató az £ 
csúcs bal fiára, jobb(x) pedig a jobboldali fiára. A módszerek tárgyalásakor ezeket 
a mutatókat olykor azonosítani fogjuk a mutatott csúccsal. Nagyjából ennyi tarto- 
zik a bínáris fák alapvető reprezentációjához. Bizonyos esetekben további mezők 
is hasznosak lehetnek, Ilyen például az xz csúcs apjára mutató apa(z) mező vagy 
az x-ből és leszármazottaiból álló z-gyökerű részfa csúcsainak számát tartalmazó 
s(x) mező. 





Példa: A következő ábra egy bináris fát mutat; a tárolt elemeket - ezek számok 
és műveleti jelek - a csúcsokba írtuk. Jelölje z a fa gyökerét, y pedíg a 9-et tar- 
talmazó csúcsot. Érvényesek a következők: bal(jobbír)) — y, apalapaly)) — a. 
elemíbal(r)) — : és sír) — 7. 


a 2 


$GGe6 


A fejezetben fontos szerep jut majd a fák alakjának. Mint látni fogjuk, azok 
a fák lesznek hasznosak, amelyek eléggé telt alakúak. Ebből a szempontból azok 
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a fák ideálisak, melyeknek a szintjeik számához képest a lehető legtöbb csúcsuk 
van. Ha a szintek száma I, akkor ez 2! — 1 csúcsot jelent. Az ilyen fákat ebben a 
részben teljes fáknak fogjuk nevezni. Ez némiképp eltér a kupac adatszerkezetnél 
bevezetett használattól. A terminológiai kettősséget azért vállaljuk, mert eléggé 
általános a szakirodalomban. 

A mostani meghatározás szerinti teljes fák úgy jellemezhetők, hogy minden 
levelük ugyanazon a szinten helyezkedik el, és minden belső csúcsuknak két fia 
van. 

A bináris fák alkalmazásainál fontos szerepet játszanak az olyan módszerek 
— bejárások — amelyek valamilyen értelmes sorrendben végigmennek a fa csúcsain, 
Általában arról van szó, hogy amikor a bejárás során az y csúcs kerül sorra, akkor 
valami y-nal kapcsolatos teendőt végzünk el (pl. kinyomtatjuk a benne tárolt in- 
formációt). A bejárásokat e teendőtől függetlenül érdemes tárgyalni, ezért egysze- 
rűen csak azt mondjuk, hogy meglátogatjuk y-t. A legismertebb bejáró módszerek 
a preorder, inorder és postorder bejárások. Itt következik a rekurzív definíciójuk; 
2 jelöli a fa gyökerét, az eljárások nevei pedig pre(), in() és post(). 





pre(x) in(z) postír) 

begin begin begin 
látogat(a); in(baltz)); post(bal(x)); 
pre(balíz)); tátogatír); postíjobbíz)); 
preljobbí(z)) in(jobb(z)) látogatír) 
end end end 


A három eljárás csak a látogat(z); helyében különbözik egymástól. A preorder 
bejárás először meglátogatja a gyökeret, majd rekurzíve hívja önmagát először a 
bal, majd a jobb részfára. Az inorder bejárásnál a látogatás a két önhívás közé 
került, a postorder-módszernél pedig a hívások mögé. 

Írjuk le az előző példa fájában levő elemeket abban a sorrendben, ahogy az 
eljárások meglátogatják a csúcsokat! 

Preorder sorrend: -k x 85 — 96; 

inorder sorrend: 8 r 5 3-9 — 6, megfelelően zárójeltezve: (8 x 5) 4 (9 — 6); 

Postorder sorrend: 85 £ 96 — -H. 

Az egyes sorrendek a fa által meghatározott aritmetikai kifejezés különböző írás- 
módjainak felelnek meg. A középső, az inorder sorrend adja a szokásos írásmódot. 

Nézzük most a módszerek költségét. Elég a preorder bejárásra szorítkozni; a 
másik kettő ugyanúgy kezelhető. Tekintsük egységnyinek a pre(y)-hívás kezdé- 
sével és befejezésével járó költségeket; itt y a fa egy tetszőleges csúcsa. Ugyan- 
csak legyen I a balíy) és jobb(y) mutatók mentén való lépés, vatamint látogatíy) 
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időigénye. Jelölje T(n) a módszer maximális költségét legfeljebb n-pontú fákra. 
Feltehetjük, hogy T(0) — 0 és a rekurzió alapján 


Tap e et max ÍT(G) 4T(n—1—i)) 


A második tag a két rekurzív hívás költsége, az első pedig a hívásokon kívüli 
munka időigényét becslő n-től független c állandó. Egyszerű indukcióval adódik 
innen, hogy Tín) £ en. Ez ugyanis nyilván igaz, han — 0. Nagyobb n-ekre pedig 
az indukciós feltevés szerint 


ke ; E9S BSE 1 Ve szjk iss 
Tapser na (e Een 1—31—ct4eln—1)— en. 


A bejárások tehát 0(n), azaz lineáris időben megvalósíthatók. 


Feladat: Tegyük fel, hogy adott az ! szintből álló f bináris fa y csúcsa. Javasol- 
junk O(i) költségű módszert a preorder (inorder, postorder) sorrendben az y után 
következő csúcs megtalálására. 


ű 
3.2. Bináris keresőfák, naiv algoritmusok 


A keresőfa adatszerkezet megvalósításai közül első helyre kívánkoznak a bináris 
keresőfák. Ezek legfőbb közös vonása, hogy a tárolni kívánt S C U halmaz ele- 
mei egy bináris fa csúcsaiban helyezkednek el, csúcsonként pontosan egy elem. 
Teljesül ezen felül a keresőfa-tulajdonság: 


Tetszőleges x csúcsra és az x baloldali részfájában levő y csúcsra igaz, 

hogy elemíy) £ elemíz). Hasonlóan, ha z egy csúcs az x jobb részfájá- 

ból, akkor elemíz) £ elem(z). 
Egy kényelmes megállapodás: a továbbiakban feltesszük, hogy nincsenek ismét- 
lődő elemek a keresőfában. Ez a megállapodás jelentősen egyszerűsíti a módsze- 
rek leírását, a bennük levő gondolatok érzékeltetését. Az algoritmusok, amiket tár- 
gyalni fogunk, kisebb-nagyobb módosításokkal működnek akkor is, ha megenged- 
jük az ismétlődéseket. A hatékonyságuk viszont romlik, ha bizonyos elemekből 
túl sok példány van; gondoljunk arra, hogy milyen használhatatlan lenne a telefon- 
könyv, ha mindenkinek ugyanaz lenne a neve. 


A megállapodást figyelembe véve a keresőfa-tulajdonság követelményeiben 
szigorú egyenlőtlenségeket érthetünk: az z bal részfájában levő elemek kisebbek 
2 eleménél, a jobb részfában levők pedig nagyobbak annál. A következő példában 
az elemek természetes számok, a rendezés a szokásos. A fában tárolt S halmaz 
(1,2,4,6,8,9). 
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Feladat: Igazoljuk, hogy egy bináris keresőfa elemeit a fa inorder bejárása nö- 
vekvő sorrendben látogatja meg. 


Keresés bináris keresőfákban 

Tegyük fel, hogy az 5 bináris keresőfának n csúcsa és ! szintje van, és legyen 
s € U. A KERESÍ(s, 5) első lépésében összehasonlítjuk S gyökerének s" elemét 
s-sel. Ha s — s", akkor megtaláltuk a keresett csúcsot (elemet). Ha s € s", akkor a 
keresőfa-tulajdonság miatt a bal, ha s 5 57, akkor a jobb részfába megyünk tovább, 
ismételve a fenti lépést. Az előző példa fájánál a KERES(4, S) a gyökérnél balfelé 
lép, hiszen 4 c 6, utána jobbra, mert 4 5 2; végül megtaláljuk a keresett elemet. 
Ugyanezt az utat járjuk be a KERES(5, 5) kapcsán. A négyest tartalmazó levélnél 
kiderül, hogy a kérdéses elem nincs a fában, hiszen eddig nem találtuk meg, és már 
nem tudunk továbblépni. 

Egy összehasonlítás és egy mutató mentén megtett lépés árán az eredetinél 
egy szinttel alacsonyabb fában folytathatjuk a keresést. Ebből következik, hogy a 
módszer költsége arányos a szintek számával: 0(7). 

A MIN és MAX műveletek is eléggé egyszerűek. Az előbbinél addig megyünk 
a gyökértől balra a fában, amíg lehetséges, az utóbbinál pedig a jobboldali irányt 
tüntetjük ki figyelmünkkel. E két eljárás költsége is (7). 

A TÓLIG(a, b, 5) hívás az 5 halmaz a és b közé eső kulcsait hivatott össze- 
gyűjteni. Evégből KERES(a, 5) segítségével megkeressük a szóban forgó inter- 
valhum elejét, majd inorder sorrendben ellépdetünk az utolsó olyan kulcsig, ami 
még nem nagyobb, mint b. Az inorder lépkedéshez hasznos a csúcsokban egy mu- 
tató — úgynevezett inorder fonal — az inorder bejárás szerinti következő csúcsra. 
Ha Vannak ilyen mutatóink, akkor TÓLIG(a, b, 5) költsége O(I -- k), ahol k az S 
tt ő b közé eső elemeinek a száma. Ha nincsenek inorder fonalaink, akkor inorder 
bejárással O(n) időben kaphatjuk meg a kívánt eredményt. 


Naiv módszerek beszúrásra és törlésre 

A különféle bináris keresőfa-típusok között a döntő különbség a beszúrás és a 
törlés algoritmusaiban van. Itt a legegyszerűbb, az úgynevezett naiv módszereket 
Mutatjuk be, A BESZÚRÁS, 5) és TÖRÖL(s, S) végrehajtása is egy KERES(s, 5) 
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hívással kezdődik. Beszúráskor a beillesztendő s elem helyét kell megkeresni 5- 
ben, a TÖRÖL(s, 5) esetén pedig a törlendő s elemet. 

BESZUÚR(s, S) végrehajtásakor a keresés után nincs teendőnk, ha már van 
olyan z csúcsa a fának, melyre elemíg) — s. Ellenkező esetben a keresés úgy 
ér véget, hogy nem tudunk továbblépni a csúcsból, ahol vagyunk. A megfelelő 
(jobb. vagy bal) fiú nincs a fában. A beszúrást úgy végezzük el ezután, hogy ezt 
a hiányzó fiút mint új levelet a fához adjuk. Az új csúcs eleme s lesz. Könnyű 
meggondolni, hogy ezután is érvényben marad a keresőfa-tulajdonság. Az eljárás 
költsége 0(1). 


Példa: Az előző 5 fába illesszük be új elemként a hetest, vagyis hajtsuk végre a 
BESZÚRIT, 5) utasítást. A kereső fázisban arra jutunk, hogy a hetesnek a nyolcast 
tartalmazó csúcs bal fiában volna a helye. Ilyen fiú nincs a fában, ezzel bővíteni 
kell a szerkezetet, Az eredmény: 


je jó 


960600 


Ami a törlést illeti, nincs érdemi teendőnk, ha a szóban forgó s elem nincs 
a fában. EHenkező esetben jelölje x az §-nek azt a csúcsát, amiben s ül. Ezek 
után TÖRÖL(É(s, 5) könnyű. ha a szóban forgó x csúcsnak legfeljebb egy fia van. 
Ekkor elegendő, hogy r-et a fiával helyettesítjük: r 6 fiú(z). Ha viszont r-nek 
két fia van, akkor ez az út nem járható: csak egyik fiút tehetnénk x helyére, a 
másik árván maradna. A megoldás az lesz, hogy a feladatot visszavezetjük egy 
könnyű törlésre, Jelölje y azt a csúcsot, amiben az z bal részfájának a maximális 
eleme van. Az x ismeretében y-t MAX (bal(z)) O(t) költséggel megadja. A recept 
ezután egyszerű. Az y-ban levő s" elemet tesszük s helyére r-be, majd töröljük az y 
csúcsot. Utóbbi egy könnyű törlést jelent. mert y-nak nem lehet jobboldali fia. Azt 
is könnyű meggondolni, hogy az így módosult fára érvényben marad a kere: 
tulajdonság. Az s" definíciója miatt kisebb az x jobb részfájának minden eleménél, 
és nagyobb a bal részfa megmaradó elemeinél. Az összköltség ekkor is O(i). 

















Példa: Az előző rajzon látható S fából töröljük a nyolcast. Ez nehéz törlésnek 
ül, hiszen a szóban forgó z csúcsnak két fia van. Az x bal részfájának maxi- 
mális (és egyetlen) eleme 7. Ez kerül x-be; a hetest tartalmazó csúcsot pedig kítö- 
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Naiv beszúrásokkal épített bináris fák átlagos költsége 

Ha egy bináris fának ! szintje van, akkor a csúcsok számára n £ 142-t 2294... 
21-1 sz 27 — 1 adódik, amiből! 2 logo(n - 1). A keresés szempontjából tehát 
a legjobb — azaz legkisebb — szintszám, amit n-pontú fánál elérhetünk, körülbelül 
log2 n. 

A következőkben érvet mutatunk amellett, hogy a naiv beszúrásokkal épített 
fák átlagos értelemben nem rosszak; egy beillesztés átlagosan O(loga n) összeha- 
sonlításba kerül. A pontos modell a következő: tegyük fel, hogy az U univerzum 
bi, c b2 £ ... Ca bn elemeiből bináris keresőfát építünk. A b; elemeket egy vé- 
letlen at, . . . , an sorrendben szúrjuk be a naiv módszerrel a kezdetben üres fába. 
Legyen T(n) a beszúrások során fellépő összehasonlítások átlagos száma. A T(n) 
mennyiséggel szeretnénk mérni a fa építésének átlagos költségét. Az átlagot az 
elemek n! lehetséges érkezési sorrendjére vesszük. Valószínűségi terminológiát 
használva úgy is fogalmazhatunk, hogy a bi, be, . . . ,bn elemek minden érkezési 
sorrendje egyenlően valószínű. Ekkor tetszőleges j-re FA az esélye, hogy az — bj, 
hiszen mindegyik elem éppen ugyanannyi (nevezetesen (n — 1)!) érkezési sorrend- 
nél lesz első. Mindez azt jelenti, hogy 


12 
(4) T(n) — z pa (az olyan fa átlagos költsége, melyre az — bj). 

jzl 
; , Egy fa költségén a felépítéséhez használt összehasonlítások számát értjük. Je- 
Jölje F(j) a zárójelben levő tagot. Ha az — bj, akkor a keresőfa-tulajdonság miatt 
végül az az bal részfájában j — 1, a jobb részfában pedig n — j elem lesz. 


b; 
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Itt a baloldali részfán belüli összehasonlítások száma T(j — 1) lesz, amihez 
hozzá kell adnunk a bj gyökérrel való összehasonlításokat. A bal részfa átlagos 
költsége tehát j — 1-4 T(j — 1). Hasonló meggondolással a jobb részfa költsége 
n-j-4T(n -— j). A kettőt összegezve kapjuk, hogy F(j) —j—-1-3T(j—-1) 4 
n-j4T(n-j)—-n-1-4T(j-—1)-4-T(n — j). Mindezeket visszaírhatjuk a (x) 
formulába. Használva azt is, hogy az üres fa ingyen van, azaz T(0) — 0, n 5 0-ra 
a következő rekurziót nyerjük: 





—-1 


T(n)-n-1k ZET. 


j70 


Vegyük észre, hogy ez megegyezik a gyorsrendezés elemzésekor kapott (-t-) re- 
kurzióval, Az ott taglalt módon adódik tehát, hogy 


Tín) c 2nlnn -- O(n) sz 1, 391 log; n 4 0(n). 


Egy elem beszúrásához átlagosan tehát legfeljebb 1,89 log, n összehasonlítás 
elegendő. A becslés érvényes a keresés átlagos költségére is. Hasonló módszerek- 
kel megmutatható, hogy az átlagos szintszám (azaz l várható értéke) is O(logn). 
Ez nem rossz, ha figyelembe vesszük, hogy adott n mellett a legjobb, amit elérhe- 
tünk ( — logo(n -- 1). Ez akkor teljesül, ha a fa teljes (Z szintje és összesen 21 — 1 
csúcsa van). 


3.3. 2-3-fák 


Ebben a szakaszban egy igen hatékony keresőfa-konstrukciót mutatunk be. Ennek 
is fa a tárolási szerkezete, de a binárisnál valamivel bonyolultabb; egy nem-levél 
csúcsnak 2 vagy 3 fia lehet. Innen származik a szerkezet elnevezése. Egy kulcs ([/ 
eleme) a fa több csúcsában is előfordulhat, és egy csúcsban egy vagy két kulcs ís 
tehet. Úgy érdemes elképzelni a helyzetet, hogy U elemei egy rekordtípus kulcsai 
(pl. személyi szám egy személyi adatokat tartalmazó rekordban). A cél a rekor- 
dok hatékony elérése, Maguk a rekordok a fa legalsó szintjén helyezkednek el, a fa 
belső csúcsai csak kulcsokat és mutatókat tartalmaznak (kivéve, ha csak egy rekor- 
dunk van). A belső csúcsokban levő kulcsok a levelekben tárolt rekordok kulcsai 
közül kerülnek ki. Szerepük az, hogy jelzőtáblák módjára segítsék a fában való 
közlekedést. 


A 2-3-fa egy (lefelé) irányított gyökeres fa, melyre igazak az alábbiak: 
1. A tárolni kívánt rekordok a fa leveleiben heiyezkednek el, a kulcs értéke szerint 
balról jobbra növekvő sorrendben. Egy levél egy rekordot tartalmaz. 
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2. Minden belső (azaz nem levél) csúcsból 2 vagy 3 él megy lefelé; ennek megfe- 
lelően a belső csúcsok egy illetve két s € U kulcsot tartalmaznak. A belső csúcsok 
szerkezete tehát kétféle lehet. Az egyik típus így ábrázolható: 

















mMsalmelsz[ 3] 








Itt mi, m2, mz mutatók a csúcs részfáira, $1, s2 pedig V-beli kulcsok, melyekre 
teljesül, hogy s1 £ 52. Az mi által mutatott részfa minden kulcsa kisebb, mint s1. 
az me részfájában sz a legkisebb kulcs, és minden kulcs kisebb, mint s2. Végül 
mg részfájában s2 a legkisebb kulcs. Előfordulhat, hogy egy csúcsból az utolsó két 
mező hiányzik. A belső csúcsoknak ez a típusa valamivel egyszerűbb alakú: 











mil s] me 





Ez esetben a csúcsnak csak két részfája van; a baloldaliban vannak az $1-nél kisebb 
kulcsú rekordok, a jobboldaliban pedig si a legkisebb kulcs. 
3. A fa levelei a gyökértől egyforma távolságra vannak. 


A következő állítás a műveletek költségének becslésekor lesz hasznos. Lénye- 
gében azt mondja, hogy a fa szintjeinek száma barátságosan alacsony a fában levő 
rekordok számához mérten. 


Állítás: Ha a fának m szintje van, akkor a levelek száma legalább 2771. Megfor- 
dítva, ha ]l$] — n (itt S C U a fában tárolt kulcsok halmaza; ISI megegyezik a 
tárolt rekordok számával), akkor m £ loggn 4. 


Bizonyítás: A 3. tulajdonság szerint a fa i-edik szintjén levő csúcsok mind belső 
csúcsok, hal £ i £ m — 1. A 2. tulajdonság szerint minden ilyen csúcsnak 
legalább két fia van. Ezekből könnyű indukcióval adódik, hogy az i-edik szinten 
legalább 27-! csúcs van (1 £ i £ m). Eztí — m-re alkalmazva 277! £ n, amiből 
logatítmusokat vévem — 1 £ log n. 


Keresés 2.3-fákban 

A kulcsoknak a részfákban való ilyen elosztása lehetővé teszi, hogy a bináris fák- 
nál megismert módszerhez hasonlóan végezzük a keresést. Legyen S egy 2-3-fa, 
És s € U. A KERES(s, 5) első lépéseként az s kulcsot összehasonlítjuk az 5 
gyökerében levő sz és esetleg s2 kulcsokkal. Ennek eredményeképpen megtud- 
juk, hogy a három (vagy két) részfa közül melyikben kell folytatni a keresést. Ha 
$ Ca 81, akkor az mi mutató mentén találjuk meg az érdekes részfa gyökerét. Ha 
51 $ s ca s2, akkor a második mutatót követjük. Ha pedig sa £ s, akkor mz 


66 3. KERESŐFÁK 


mutatja a helyes irányt. Természetesen, ha $2 és mz hiányzik, akkor csak két eset 
van: 8 € 84, illetve si £ 8. 

A keresést aztán ugyanígy folytatjuk egy szinttel lejjebb. Legyen n a fában 
tárolt rekordok száma, m pedig a fa szintjeinek a száma. Az elmondottak szerint 
szintenként nem több, mint két kulcs-összehasonlítással, összesen tehát legfeljebb 
2m-mel kideríthetjük, hogy a keresett rekord benne van-e a fában. Igenlő válasz 
esetén meg is találjuk az s kulcsú rekordot. Az állítást figyelembe véve látjuk, 
hogy az összehasonlítások száma legfeljebb 2(loga n 4 1); a többi költség arányos 
ezzel. Így a kere: zköltségére igen kedvező korlátot kapunk: O(logn). A 
korlát minden esetben (tehát nem csak átlagos értelemben) érvényes. 








Beszúrás és törlés 
A 2. és 3. követelmények igen szigorúan szabályozzák a 2-3-fák alakját. Ennek a 
két tulajdonságnak köszönhető a versenyképes keresési idő. A beszúrás és törlés 
kapcsán a fő gondot az jelenti, hogy megőrizzük érvényességüket. A módszerek 
lényeges ötleteit példákon keresztül mutatjuk be, Ennek során feltesszük, hogy U 
elemei nagybetűk: A, B, C . . ., a szokásos rendezéssel. € 

A BESZÚR(s, §) végrehajtása kereséssel kezdődik, és csak akkor van érdemi 
munka, ha nincs a fában s kulcsú levél. Tegyük fel, hogy ez a helyzet, és jelölje z 
a legalsó belső csúcsot a kereső út mentén, Tegyük fel, hogy z így néz ki: 








milJÍIma 





Az mai által meghatározott levél kulcsa legyen C (a másik levélé szükségképpen 
J). Ha például s — K, akkor x így módosul: 
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Az mz mutató fog az új levélre mutatni, Ha viszont s — I, akkor x tartalma a 
következő lesz: 
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Ha s a legkisebb kulcsot is megelőzi, mondjuk 8 — A. akkor z így alakul: 
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Az új rekord beillesztése tehát elég egyszerű, ha x-nek csak két fia van. 
Igazán érdekessé akkor válik a helyzet, ha a beszúrás előtt z már két kulcsot 
tartalmaz. Tegyük fel, hogy z a legutóbbi ábra szerinti állapotban van, és nézzük, 
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mi a teendő, ha most az s — H kulcsú rekordot kell beilleszteni. Ekkor alkal- 
mazzuk a csiícsvágás elnevezésű elegáns ötletet: az z mellé egy további y csúcsot 
veszünk. A két csúcs tartalma 





[ÓnJElm ] iltetve [maTJÍme] 

















lesz. Az ma fog a H kulcsú rekordra mutatni. Ezután az új y csúcsot is a fába kell 
illeszteni. Ez azt jelenti, hogy az x apjába kell egy új kulcs-mutató párt tennünk. 
A beillesztendő kulcs a három érintett (a két régi és az új) közül mindig a nagy- 
ság szerint középső. Ez a kulcs a jelen esetben . Az egy szinttel feljebb történő 
beszúrást ugyanazzal a módszerrel végezzük, ahogy r-nél eljártunk. Tehát ha z 
apjának csak két gyermeke volt, akkor az egyszerű ágon fejezzük be a munkát. 
Ha nem, akkor itt is csúcsvágást alkalmazunk, A csúcsvágások sora elgyűrűzhet 
esetleg a fa gyökeréig. Mi ilyenkor a teendő? Tegyük fel, hogy az utolsó példában 
x a fa gyökere volt. (Ekkor az m; mutatók esetleg nagyobb részfákra mutatnak.) 
A csúcsvágás után keletkező x és y rekordok fölé egy új gyökeret teszünk: 





[mi HIr71 











Itt m az x, m! pedig az y csúcsra mutat. A fa szintjeinek száma eggyel nőtt. A 
lényeges mozzanat ebben, hogy a növekedés a fa tetején történt; ezáltal megtar- 
tottuk a 2-3-fákkal kapcsolatos 3. követelményt. A gyökértől levélig menő utak 
mindegyike hosszabb lett. A második követelményről is gondoskodtunk: az ese- 
teket végignézve az olvasó meggyőződhet arról, hogy sehol sem hagytunk belső 
csúcsot kettőnél kevesebb gyermekkel. 





Nézzük mármost a TÖRÖL(s, §) végrehajtását. Legyen ismét x a legalsó belső 
csúcs a kereső út mentén. Ha r-nek három fia van, akkor az s kulcsú levél törlése 
után x-ben az értelemszerű változtatásokat elvégezve készen vagyunk. Gondot 
jelent viszont, ha x-nek csak két fia van. Ekkor a törlés után megsérülne a 2-3- 
fákkal szembeni 2. követelmény, hiszen x-nek csak egy fia maradna. Még mindig 
egyszerű a dolgunk, ha x (valamelyik) szomszédos testvérének 3 fia van: ekkor 
ugyanis ezek közül egyet áttehetünk x-be, Csak -et, adakozó kedvű testvérét és 
az apjukat kell módosítani. Ezeket a módosításokat elvégezve ismét készen va- 
gyunk. 

Mindezek nem lehetségesek, ha z egyik szomszédos testvérének sincs három 
részfája. Ekkor használható a csúcsvágás fordítottját jelentő gondolat, a csúcs- 
összevonás. A csúcsösszevonás lényege, hogy x-et és az egyik testvérét egyetlen 
csúccsal helyettesi . Ennek a csúcsnak három fia lesz. A csúcsösszevonás kivi- 
telezését is egy példán keresztül mutatjuk be. Legyenek z és a fában szomszédos 
testvére, y az alábbiak: 
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Legyenek az mz, illetve ms által mutatott levelek kulcsai A és K. (Az mo-höz és 
ma-hez tartozó kulcsok szükségképpen J, illetve M.) Ha s — K a törlendő kulcs, 
akkor az összevonás után x így néz ki. 











Ím J]mo2lM ma] 














Az y csúcsot töröljük. A K kulcsértéket és a hozzá tartozó mutatót törölni kell a 
apjából (törlés egy szinttel feljebb). A többi három eset (azaz A vagy J vagy M 
törlése) hasonlóan végezhető, Csúcsösszevonáshoz vezető törlés után egy szinttel 
magasabban is felmerül egy törlési igény. Ezt az ítt ismertetett módon kezeljük. 
Ennek során is szükség lehet csúcsösszevonásra, ami törlést igényel a nagyapák 
szintjén; és így tovább. A beszi 1 tapasztalt jelenséghez hasonlóan a törlések 
ís elgyűrűzhetnek egészen a gyökérig. Külön figyelemre akkor van szükség, ha 
a törlés után a gyökérnek csak egyetlen fta maradna. Például tegyük fel, hogy a 
gyökér 









alakú, és törölnünk kell az L kulcsot és a hozzá tartozó ma mutatót. Ekkor az 
mi által mutatott részfa gyökere lesz az új gyökér. A fa szintjeinek száma eggyel 
kevesebb lesz, A változás ismét a fa tetején történt, ebből könnyen következik, 
hogy a törlés algoritmusa is megtartja a 2-3-fákkal kapcsolatos követelményeket. 

Mind a BESZÚR, mind a TÖRÖL költsége O(logn), hiszen munkát csak a 
kereső út csúcsain, illetve azok közvetlen szomszédain kell végezni; továbbá egy 
csúcsra konstans mennyiségű összehasonlítás és mezőmódosítás jut. 

TÓLIG(a, b, S) megvalósítása hasonló a bináris fáknál tárgyalt megoldáshoz. 
Először megkeressük §5-ben a keresési intervallumba eső legkisebb elemet; ennek 
költsége az előbbiek szerint O(log n), majd végiglépkedünk a felső korlátig. Ez 
utóbbi fázis a fa leveleinek növő sorrendű láncolásával segíthető. Az összköltség 
O(log n -- d), ahol d az eredményül kapott rekordok száma. 








elvégezhető O(1og n) költséggel, ahol n a tárolt rekordok száma. A 2-3-fák ai- 
gorítmusai viszonylag egyszerűen pragramozhaták, és a gyakorlatban is kedvező 
viselkedési mutatnak. 
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3.4.  B-fák 


A B-fák és különböző változataik (B"-fák, stb.) adják a keresőfa adatszerkezet 
ma ismert legjobb külső táras megvalósítását. A módszerek olyannyira fontosak 
és elfogadottak, hogy szabványok részeivé váltak. Ilyen megoldást ír elő egyebek 
között az IBM VSAM szabványa indexelt szekvenciális átományok létrehozására, 
kezelésére. A B-fákat és algoritmusaikat a feladat jelentőségéhez és a megoldások 
egyszerűségéhez képest meglehetősen későn fedezték fel (R. Bayer, E. McCreight, 
1972). 

A cél tehát egy rekordokból álló állomány tárolása külső tárban úgy, hogy az 
elérés alapjául egy (U, €) rendezett halmazból való kutcsok szolgálnak. A kitün- 
tetett műveletek itt is a következők: BESZÚR. TÖRÖL, KERES, MIN, MAX, 
TÓLIG. Ezeket szeretnénk hatékonyan megvalósítani. 

A külső tárak alapvető sajátosságairól már szóliunk a rendezés kapcsán. A 
tárat lapokba szervezettnek fogjuk elképzelni. Ennek folyománya például. hogy 
a fák csúcsai is lapok lesznek. A költségtényező pedig, amivel a hatékonyságot 
mérjük, a lapelérések száma. 

A B-fák a 2-3-fák természetes általánosításai. A lényegi különbség abban van, 
hogy a B-fák bels inak háromnál több fia is lehet. Kevésbé fontos különb- 
ség, hogy a fa egy levelében (amit egy lapnak képzelhetünk el) egynél több rekord 
is helyet kaphat. Legyen m 2 3 egy egész. 













Egy m-edrendű B-fa, röviden Bn-fa egy gyökeres, (lefelé) irányított fa, melyre 
érvényesek az alábbiaknak: 

(a) A gyökér foka legalább 2, kivéve esetleg, ha a fa legfeljebb kétszintes. 

(b) Minden más belső csúcsnak legalább [5 fia van. 

(c) A levelek a gyökértől egyforma messze vannak. 

(d) Egy csúcsnak legfeljebb m fia lehet. 


A 2-3-fák esetéhez hasonlóan a tárolni kívánt rekordok itt is a fa leveleiben helyez- 
kednek el; egy levélben a lapmérettől és a rekordhossztól függően több rekord is 
lehet. A leveleket jelentő lapok balról jobbra, kulcsérték szerint növekvő sorrend- 
ben láncolva helyezkednek el. 

A B.fák belső csúcsai is hasonlítanak a 2-3-fák belső csúcsaira. Az eltérés 
annyi, hogy itt több bejegyzés lehetséges. Egy belső csúcs így néz ki: 


Ez 81] mij 82 mol] si) mi] 


ahol a (b) és (d) követelményeknek megfelelően It Si ézet ke 
rábbi jelöléseinkkel összhangban az s; € U egy kulcs, m; pedig mutató egy részfa 
gyökerére. Az m; mutató által meghatározott részfa minden s kulcsára igaz, hogy 
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§j £ sés s Ca 8341. Az mg, illetve m; részfák kulcsaira csak egy feltétel van: az 
elsőben a kulcsoknak kisebbeknek kel) lenniük, mint s1, az utolsóban pedig leg- 
alább akkoráknak, mint s;. Előírható még az is (bár az algoritmusok működéséhez 
nem feltétlenül szükséges), hogy j 5 0 esetén m; részfájában a minimális kulcs 
sz legyen. A fának azon szintjeit, ahol a belső csúcsok helyezkednek el, index- 
szinteknek szokás nevezni, 

A meghatározó tulajdonságokból közvetlenül láts: 
ben a 2-3 fa. A B-fák a 2-3-fák természetes általán sainak tekinthetők. Ahogy 
már utaltunk rá. a B-fákat elsősorban külső táras adatszerkezetként alkalmazzák, 
és ebből adódóan egy csúcsnak általában egy lapot foglalnak le. Így m aktuális 
értéke a lapméret, a kulcshossz és a mutatók hosszának függvénye. Ugyanakkor 
az is gyakran előfordul, hogy egy levélben több, mint egy rekord helyezkedik el. 

Tegyük fel. hogy egy B-fának n levele és £ szintje van, és keressünk össze- 
függést e két paraméter között. Az érdektelen kicsi fáktól eltekintve a gyökér- 
nek legalább két fia van, a többi belső csúcsnak pedig legalább [8]. A 2-3- 
fákra vonatkozó állításhoz hasonlóan kapjuk ezekből, hogy n 2 2(ZJÉ?, amiből 
logrej 5422 k. Innen kettes alapú logarítmusra térve 


ik, hogy a B3-fák lényegé- 











logjn—1 
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7 log §] 


Keresés során itt is a gyökértől haladunk a levelek felé; az aktuális csúcs- 
ban levő kulcsokkal való összehasonlítások mondják meg, hogy melyik részfába 
kell továbblépni. Vegyük észre, hogy k éppen a kereséshez szükséges lapelérések 
száma, feltéve, hogy minden lap külső tárban van. (Nem szokatlan gyorsítási ötlet 
a fa felső néhány szintjének a belső memóriában való tárolása.) A kapott korlát 
mutatja, hogy nagy m érték (nagy elágazási tényező) az előnyös. 

Például, ham — 32, n — 29 (itt n az alsó szint lapjainak száma), akkor 
k A 2 42 c 7. Egy rekord keresése tehát legfeljebb 6 lap elérését igényli. 
Megjegyezzük még itt, hogy a becsiésben úgy vettük, hogy a lapok éppen a (b) 
feltételbeli minimális mértékben vannak kitöltve. A gyakorlatban ez a szélsőséges 
helyzet meglehetősen ritkán fordul elő; a tényleges keresési idő valamivel kedve- 
zőbb a becsültnél. 

A további keresőfa-műveletek (MIN, MAX, TÓLIG, BESZÚR , TÖRÖL) i 
2-3-fák műveleteinek kézenfekvő általánosításai, Így például a beszúrásnál csi 
vágást, a törlésnél csúcsösszevonást alkalmaznak. Ezeket a technikákat ebben az 
összefüggésben fapvágásnak, illetve fapösszevonásnak nevezzük. Az algorítmu- 
sok részleteit mellőzzük; csak annyit jegyzünk: itt meg, hogy a költségük — a 
TÓLIG kivételével — ez esetben is arányos a szintek számával. 
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Példa: A Bi1-fák esetén keresztül szeretnénk érzékeltetni, hogy a (b) és (d) fel- 
tételek tényleg megtarthatók lapvágás/összevonás során. Ekkor ugyanis m — II 
és [1 — 6. Lapvágásra akkor kerül sor, ha egy olyan c: kell új gyereket 
illeszteni, amelyben már 1! mutató van. A vágás után az összesen 12 gyerek 2 
hatgyermekes csúcsot fog alkotni, tehát (b) éppen teljesül. 

Lapösszevonásra akkor kényszerülünk, ha egy olyan hatgyermekes csúcsból 
keli törölni, amélynek a szomszédos testvéreiben is csak hat mutató van. A törlés 
és összevonás után két csúcs helyett egyet kapunk; ebben 11 mutató lesz. 








3.5.  AVL-fák 


Egy időre visszatérünk a bináris keresőfákhoz. Korábban láttuk, hogy a keresés és 
a többi művelet sebességének szemszögéből a lényeges jellemző a fa szintjeinek 
száma, más szóval magassága. Minél kisebb a magasság, annál jobb becslés ad- 
ható a ker idejére. Mi ezt a legkedvezőtlenebb esetekre állapítottuk meg, de 
hasonló a helyzet az átlagos viselkedéssel! is. Egy fa magassága akkor mondható 
jónak, ha legfeljebb cloga n, ahol n a csúcsok száma és ec egy kis pozítív állandó. 
A legterebélyesebb fáknál ez a c érték [ körül van; gondoljunk a teljes fákra, ame- 
lyek magassága logoín -- 1). Az olyan fa-konstrukciókat, amelyeknél c 1-nél nem 
sokkal nagyobb, kiegyensúlvozott fáknak nevezzük. A c értéket illetően két ellenté- 
tes irányú tényezőt kell figyelembe vennünk. A keresés szempontjából a kisebb c a 
jobb; ugyanakkor nagyobb c-vel a feltétel könnyebben teljesíthető, algoritmikusan 
kényelmesebben elérhető. 

Az első kiegyensúlyozott keresőfa-konstrukciót, amit szemügyre veszünk, 
AVL-fának nevezik. Az elnevezés a szerkezet szerzőinek névbetűiből alkotott mo- 
zaikszó (G. M. Adelszon-Velszkij, E. M. Landisz, 1962). Hasznos lesz a követ- 
kező: jelölje m(f) az f bináris fa magasságát (szintjeinek számát). Legyen xz az f 
fa egy csúcsa; ekkor míg) jelöli az x-gyökerű részfa magassi 
























Definíció (AVL-tulajdonság): Egy bináris keresőfa AVL-fa. ha minden x cstícsárdt 
teljesül. hogy 
Imíbalíz)) — mijobbíz I EL 


A feltétel szerint egy csúcs jobb és bal részfájának a magassága közel egyenlő. 
Most megmutatjuk. hogy az előírás tényleg egy kiegyensúlyozottsági feltétel. Lát- 
szólag messziről kezdjük: legyen Gx a k magasságú (szintszámú) AVL-fák mini- 
csszáma. Próbáljuk meghatározni G4 nag; rendjét! Az első néhány 
ra könnyen kapjuk a pontos értékeket: G1 — 1. G2 — 2, Gz — 4és Gy — 7. 





k. 
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MEN 


A rajzon látható szabályszerűség általában is érvényes. A k szintszámú mini- 
mális csúcsszámú AVL-fa gyökerének egyik részfája k — 1, a másik k — 2 szintű; 
az eredeti fa minimalitása miatt pedig mindkét részfa minimális csúcsszámú. 


ss 


Innen k 2 3 esetén az alábbi rekurziót nyerjük: 
G451-4Ghk-1 tt Gk-2 


Emlékeztetjük az olvasót, hogy F; jelöli az í-edik Fibonacci-számot. Érvényes a 
következő: 


Tétel: Gy — Fk42—1lhak21 


Bizonyítás: k — 1, 2 esetén az állítás nyilvánvaló. Ha pedig k 5 2. akkor a 
rekurzió alapján indukciót használhatunk: 


G4514Gro1tGr-2 lt Fr41—1tF4p—1— Fh4y2 1. 


Az utolsó lépésben alkalmaztuk a Fibonacci-számokra teljesülő Fp41--F4 — Fr4.2 
összefüggést. 7 


Következmény: Egy n-pontú AVL-fa szintjeinek k száma nem több mint 
0(log n), pontosabban k £ 1.441ogo(n 4 1). 


Bizonyítás: A tétel szerint n 2 F442 — 1. Innen a Fibonacci-számokra vonatkozó 
alsó becslésből n--1 2 é! és ezért logy(n 1) 2 k. amiből k S 1.44logo(n-t- 1). 
a B 
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Az AVL-fák tényleg tekinthetők kiegyensúlyozott fáknak. A kérdéses c érték 
1.44 körül van. Úgy is fogalmazhatunk, hogy az AVL-fákban való keresés haté- 
kony, mert a magasságuk legfeljebb 1.44-szer nagyobb az ugyanannyi csúcsból 
álló tökéletes alakú bináris fáénál. 


A kérdés ezek után, hogy miként lehet az AVL-tulajdonságot megőrizni, kar- 
bantartani? Hogyan lehet a BESZÚR és TÖRÖL eljárásokat úgy megvalósítani, 
hogy megtartsák az AVL-tulajdonságot? Az alapvető eszköz a forgatás. Legyen § 
egy bináris keresőfa, melynek gyökere az z csúcs, ennek bal fia y, Jelölje f az 
y bal, g pedig a jobb részfáját. Legyen h az z jobb részfája. A bináris keresőfa- 
tulajdonság megmarad, ha az 5 fát átalakítjuk úgy, hogy y lesz a gyökere, ennek 
bal részfája marad f, az y jobb fia z, ennek részfái g (bal) és h (jobb). Ezt az 
átalakítást jobb forgatásnak nevezzük, az inverzét pedig bal forgatásnak. 


cg bal forgatás 
jobb Torgatás 


jó A 
Legyen az § bináris keresőfa, gyökere az x csúcs, ennek bal fia y, y jobb fia 2. 


Végezzünk el egy bal forgatást az y gyökerű részfára, majd egy jobb forgatást az 
így kapott 9-re. Ennek az operációnak a neve dupla forgatás. 


a dupta forgatás 2 
9 aA ga 
(A AJ AAD A 


Dupla forgatásnak nevezzük ennek a lépéspárnak a tükörképét is, amikor y az 
T jobb fia, és z az y bal fia. A beszúrás és törlés megvalósítására a naiv algorítmu- 
Sokat használjuk, kiegészítve azzal, hogy a művelet elvégzése után forgatásokkal 
visszaállítjuk (ha szükséges) az AVL-tulajdonságot. 


Tétel: Legyen S egy n csúcsból álló AVL-fa. BESZÚR(s, S) után legfeljebb egy 
fesetleg dupla) forgatással helyreállítható az AVL-tulajdonság. A beszúrás költ- 
sége ezzel együtt is O(logn). 
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Bizonyítás: A korábbiakkal összhangban egy f fa (z csúcs) esetén jelölje m(f) 
(m(7)) az f fa (a z gyökerű részfa) magasságát. Az S fa minden csúcsában fel- 
jegyezzük az itt gyökerező részfa szintjeinek számát. Ez a mező könnyen karban- 
tartható a naiv beszúrás és törlés során. ( Valójában mindössze 2 bit/csúcs extra 
információ is elég az AVL-tulajdonság helyreállításához. Ezt itt nem részletezzük.) 
A naiv beszúrás után a keresési út ismételt bejárásával megkapjuk a legalsó olyan 
csúcsot (ez legyen x), ahol az AVL-tulajdonság megsérül. 








Az r definíciójából adódik, hogy z bal és jobb részfájának nem lehet ugyanaz 
a magassága. Az általánosság csorbítása nélkül feltehetjük, hogy a bal részfa ma- 
gasabb, jelesül nem üres. (Ha a jobb részfa a magasabb, akkor az alább következő 
recept tükörképével, benne a jobb és a bal felcserélésével érhetünk célt.) Legyen 
ezek után a bal részfa gyökérpontja y, ennek a részfái pedig f (bal) és g (jobb). Az 
2 jobb részfája legyen h. Legyen m(y) — I; ekkor szükségképpen m(h) —1— 1. 
Két esetet különböztetünk meg: a beszúrás során 
(a) az s az f-be kerül; 

(b) az $ a g-be kerül. 

Nézzük először az (a) esetet. Ekkor m(f) — míg) — 7 — 1. Ugyanis 
m(f) c míg) esetén a beszúrás nem tudná megsérteni az AVL-tulajdonságot T- 
ben. Másfelől míf) 2 míg) azt jelentené, hogy y-ban is — tehát x alatt — sérül 
az AVL-tulajdonság. Innen adódik, hogy mí(f) — míg) z míyy-1—-17-1. 
Eme ismeretek birtokában állítjuk, hogy az r-nél elvégzett jobb forgatás megoldja 
a problémát. 


ő ÁTÉA 


A forgatás után y mindkét részfájának a magassága ! lesz, x új részfái g és h, 
mindkettő szintszáma ( — 1. Ezen csúcsok és részfák rendben vannak. Az x defi- 
níciója miatt f-ben az s beillesztése után sem sérülhet az AVL-tulajdonság. Végül 
megjegyezzük, hogy az új helyre került y feletti csúcsok magassága ugyanannyi 
marad a beszúrás és forgatás után, mint amennyi eredetileg volt; így az AVL-feltétel 
feljebb is megmarad a kereső út mentén. 


Nézzük most a (b) lehetőséget, amikor is s az y jobb részfájába kerül. Ezt 
mindjárt két alesétre bontjuk. 
(b) az új csúcs y fia, azaz ( — 1; 
(b2) az új csúcs y-nak nem fia, más szóval ( 5 1. 

A (b) esetben y bal részfája és a jobb részfája is üres, ezért elegendő egy 


dupla forgatás r-nél. 
űj Fák 
6 9 


A (b2) esetben a g részfa nem üres, hiszen m(g) —1— 1 5 0. Legyen a részfa 
gyökere z, ennek részfái g" és 9". Az s kulcs e két részfa valamelyikébe kerül, a 
továbbiak szempontjából közömbös, hogy melyikbe. Ekkor m(f) — 1— 1 (mert 
yrban az AVL-feltétel teljesül), és m(g") — m(g") — I — 2 (mert 2-ben sincs baj 
az AVL-tulajdonsággal). Egy kettős forgatás mindent helyretesz. 
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A részfa új gyökere z kiegyensúlyozott lesz, m(z) — 1 4 1. Ennyi volt míz) 
a beszúrás előtt, A z bal fia y balsúlyos vagy kiegyensúlyozott lesz aszerint, 
hogy s a g" vagy 9" részfába kerül-e. Ugyanígy z jobb fia z lesz, ami jobb- 
súlyos vagy kiegyensúlyozott. Ezzel az algoritmus ismertetését befejeztük. Az 
itt vázolt eljárás költsége nyilvánvalóan arányos a naiv beszúrás költségével; az 
m(5S) £ 1.44logo(n 4 1) egyenlőtienségből látszik, hogy ez O(logn). 


A törlés algoritmusa is hasonló felépítésű. Először a naiv módszerrel eltávolít- 
juk a törölni kívánt elemet, majd — ha szükséges — alkalmas forgatásokkal helyre- 
állítjuk az AVL-tulajdonságot, 


Tétel: Az n szögpontú AVL-fából való naiv törlés után legfeljebb 1.44logan 
(szimpla vagy dupla) forgatás helyreállítja az AVL-tulajdonságot. 


Ezt nem bizonyítjuk. A helyreállító fázis valamivel bonyolultabb, mint a be- 
szúrásnál alkalmazott módszer. Előfordujhat, hogy a törlési út mentén több csúcs- 
nál is kell forgatást végezni. A törlés költsége evvel együtt is O(log n). 


Feladat: Adjunk példát egy olyan AVL-fára, melynél egy alkalmas törlés után nem 
állítható helyre az AVL-tulajdonság egyetlen (szimpla vagy dupla) forgatással. 


Megjegyzés; A forgatások szoros kapcsolatban vannak az asszociatív szabállyal. 
Képzeljük el, hogy van egy kétváltozós műveletünk, mondjuk x. E művelet segít- 
ségével kifejezéseket készíthetünk (pl. (z xy) x (z ru), ahol x,y, z, u változók). 
Egy kifejezésnek természetes módon megfelel egy bináris fa, melynek levelei a 
változók. Ebben a kifejezésfában forgatások felelnek meg a kifejezés asszociatív 
szabály szerinti átalakításainak. 


3.6. TOVÁBBI MEGJEGYZÉSEK KIEGYENSÚLYOZOTT FÁKRÓL TI 


(ímeyj szen (zeyjs(zsu) 


Az ábrán baloldalt levő kifejezésfából a gyökérnél elvégzett jobbforgatással 
keletkezett a másik fa. Látható, hogy az új kifejezés a régiből az asszociatív szabály 
egyszeri alkalmazásával származtatható. 


3.6. További megjegyzések kiegyensúlyozott fákról 


Az AVL-tulajdonság olyan szabályt, előírást jelent, melyet ha megtartunk, akkor 
kiegyensúlyozott fát kapunk. Az AV.L-fák magassága legfeljebb mintegy [.44- 
szerese az ideális fákénak. Ez biztosítja, hogy a bennük való keresés hatékony. Az 
AVL-tulajdonság csak egy a lehetséges kiegyensúlyozottsági feltételek közül. Más 
olyan tulajdonságok is vannak, amelyek hasonló módon szabályozzák a fa alakját, 
és a megőrzésük sem jelent túl nagy algoritmikus nehézséget. E tulajdonságok 
(konstrukciók) közül kettőt érintünk a továbbiakban. 


HBIKI-fák (€. C. Foster, 1973) 

Legyen k 2 1 egy egész szám. Egy bináris keresőfa H B[k]-fa, ha minden £ csú- 
csára teljesül, hogy Im(bal(r)) — mijobbíz))I £ k. Az előírás az AVL-feltétel ál- 
talánosítása. Speciálisan a H.B[1]-fák éppen az AVL-fák. Az AVL-fák esetéhez ha- 
sonló, bár valamivel bonyolultabb módon megmutatható, hogy a H BIK]-feltétel 
általában is kiegyensúlyozott fákat eredményez. 


Feladat: Az előbbi definícióból kizártuk a k — 0 esetet. Mi lehet ennek a magyará- 
Zata? Miért alkalmatlanok a H .B[0]-fák a keresőfa adatszerkezet megvalósítására? 


Súlyra kiegyensúlyozott fák (J. Nievergelt, B. Reingold, C. Wong. 70-es évek) 
Az előző feltétel a részfák magasságának a szabályozásával biztosította a kellően 
telt alakú fákat. Erre a célra más kombinatorikus tulajdonságok is alkalmasak. 
Ilyen jellemző lehet például a részfák csúcsainak száma. 
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Legyen z egy bináris fa csúcsa. Az z csúcs siílya az r-gyökerű részfában levő 
csúcsok száma. Az £ csúcs súlyának a jele s(z). Például a következő fában s(z) — 
6, s(y) — 3 és s(z) 52. 


Definíció: Egy bináris keresőfát súlyra kiegyensúlvozott fának (röviden SK- 
fának) nevezünk, ha minden x belső csúcsára teljestit, hogy 


V2-1c ESTTTt s4341 


Láthatjuk, hogy az $K-feltétel jobb-bal szimmetrikus, Az egyenlőtlenségek 
reciprokát véve kiderül, hogy V2— 1 c Kner c 2 Lis igaz. 

Feladat: Igazoljuk, hogy a leheletnyivel szigorúbb 1/2 c JE RAKATN £ 2 korlátokat 
már csak az / szintből álló, 2 — 1 pontú bináris fák a teljesítik. 

Most megmutatjuk, hogy az $K -feltétel tényleg kiegyensúlyozott fákhoz ve- 
zet; a magasságkorlátban szereplő c állandó 2-nek adódik. Legyen evégből § egy 
SK -fa, melyre s(5) — n és m(5S) — k, Legyen x az § egy belső csúcsa, melynek 
bal fia y, a jobb fia pedig z. 


sz 
(A 


Ekkor s(z) 5 s(y) 4 s(z) 5 (v2— 1)s(z) 4 s(z) — v2s(z). Az első 
egyenlőtlenség a súly definíciója, a második pedig az 5K-feltétel miatt igaz. In- 
nen az SK-feltétel jobb-bal szimmetriáját használva megállapíthatjuk, hogy ér- 
vényes az s(r) 5 vV3sfy) egyenlőtlenség is. Legyenek most £1,2,...,Ck 
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egy k-hosszúságú gyökértől levélig menő út csúcsai. Az S gyökere xi, amiből 
n — s(5) — s(x1) továbbá 71, 72... , zx-1 belső csúcsai 5-nek. Az előbb nyert 
egyenlőtlenségek ismételt alkalmazásával kapjuk, hogy 


n- sín) 2 V25(x2) - (V22s(xs) etési (2 s(xx) - vgy, 


A lánc elejét a végével összevetve n 5 (v/2)ket amiből logaritmusra térve 
2logan-41 5 k adódik. Egy n csúcsból álló SX -fa magasságának maximuma 
legfeljebb 2logan -- 1. 


Egy további alkalmazás 

A kiegyensúlyozott fák alkalmasak a tárgyalt alapfeladatokon kívül más problé- 
mák hatékony megoldására is. Példaként említjük a rendezett listák összefűzé- 
sének feladatát. Az elemek inorder sorrendjére gondolva egy AVL-fa felfogható 
rendezett listának. Tegyük fel, hogy van két rendezett listánk, 51 és 52, melyeket 
egy-egy AVL-fában tárolunk. Tegyük fel továbbá, hogy az 52-ben szereplő kulcsok 
mind nagyobbak az 51 kulcsainál. Célunk a két lista egyesítése; a két AVL-fát sze- 
retnénk minél hatékonyabban egyetlen AVL-fává összefűzni, Megmutatjuk, hogy 
ez megtehető O(log n) költséggel, ahol n a két lista összesített elemszáma. A fák- 
ról feltételezzük, hogy a csúcsai tartalmazzák az ott gyökerező részfák magasságát. 
Legyen m(51) 3 m($52). (A fordított eset hasonlóan kezelhető.) Az eljárás fő lé- 
Pései a következők: 


1. Megkeressük és ljük 52 legkisebb elemét (legyen ez 5). A törlés eredmé- 
nyeként kapott fát jelölje Sz. 

2. S1 gyökerétől indulva, és rendületlenül jobbfelé haladva megkeressük az első 
olyan x csúcsot, melyre míg) — m(5S3) — 0 vagy 1. (A feltétel azért tartalmaz két 
lehetőséget, mert egy lépésnél a magasság 1-gyel vagy 2-vel csökkenhet.) 

3. Ezután z helyére egy új csúcsot teszünk, melynek kulcsa s. Az új csúcs jobb 
részfája Sz, bal részfája pedig az §1 fa x-gyökerű részfája lesz. Végül helyreál- 
Jítjuk az AVL-tulajdonságot. Erre a beszúró algoritmus ötletei alkalmazhatók: úgy 
Járunk el, mintha az s csúcsot szúrtuk volna be a fába. 
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Könnyen ellenőrizhető, hogy az így kapott fa teljesíti a keresőfa-tulajdonságot 
és az AVL-feltételt is. A költségkorlát azonnal következik abból, hogy Sz és 52 
magassága is 0(log n). 


3.7. . Egy önszervező megoldás: az 5-fák 


Kvasztics felriadt álmúbót, meglátta az ájult őrt, 
és fáradtan körülnézett. 
— Csak menjetek nyugodtan... 
megvizsgálom és ellátom kö 
- Az nem elég — súgta Tuskó — a száját is tömje 
be, ha már ápolás alá veszi. 

REJTŐ JENŐ: A három testőr Afrikában 


— mondta — az őrt 
el. 





Az eddig vett hatékony keresőfák algorítmusai zord szigorúsággal vigyáznak a 
fák alakjára. Ezáltal a műveletek legkedvezőtlenebb eseteire is biztosítani tudják 
a O(logn) nagyságrendű kortátot. ahol n a tárolt elemek száma. Egészen más- 
féle szemléletet képvisel az itt bemutatásra kerülő önszervező bináris keresőfa- 
konstrukció, melynek neve 5-fa. Az elnevezés az angol spígy 1ree (kifordított fa) 
kezdőbetűjéből származik. Az 5-fákat D. D. Sleator és R. E. Tarjan javasolták 
1983-ban. 

Egy 5-fa a tárolási szerkezetét illetően egyszerűen egy bináris keresőfa, Érde- 
kessé és hatékonnyá az alapműveletekre javasolt módszerek teszik. Ezek az algo- 
ritmusok semmiféle közvetlen figyelmet nem szentelnek a fa alakjának. Előfordul- 
hat például, hogy a fában hosszú utak vannak, és ezért bizonyos keresések lassúak. 
Az §-fák tehát nem feltétlenül kiegyensúlyozottak. Ezzel szemben hosszabb ope- 
rációsor (keresések, beszúrások, törlések, stb.) alatt , tanulnak": az egyes elemek 
elérési gyakoriságai és ezen elérések időbeli eloszlása szerint változtatják alakju- 
kat. Úgy is mondhatjuk, hogy a fa idomul a felhasználói igényekhez. 

Az §-fák algoritmusai mögött egy nagyerejű és sok esetben használható gon- 
dolat húzódik meg. Ha a felhasználói igények teljesítése (mondjuk keresés) közben 
eljutunk valahova, akkor nem távozunk onnan szűkkeblűen, pusztán csak a köte- 
lezőket elvégezve. Rászánunk még valamennyi időt, hogy szépítsük, alakítsuk a 
környéket ahová kerültünk. Ez az idő (nagyságrendileg) nem több, mint amit a 
felhasználói kérésre amúgy is fordítanunk keli. A ráfordítás javítja a szerkezet ha- 
tékonyságát, aminek az eredménye az lesz, hogy a jövőbeli kéréseket gyorsabban 
tudjuk teljesíteni. Ezzel a filozófiával később is találkozni fogunk a szekvenciális 
keresés önszervező módszereinél és az UNIÓ-HOLVAN adatszerkezetnél, 
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Az §-fák alkalmazkodó képességének két konkrétabb megnyilvánulását említ- 
jük: 
1. Egy hosszú műveletsor esetén az egy műveletre eső költség konstans szorzó 
erejéig optimális lesz. Ha tehát a fa elég sokáig él, akkor az összesített időigénye 
nem lesz számottevően rosszabb a legjobb kiegyensúlyozott fákénál. E tulajdonság 
pontosabb megfogalmazása a szakasz végén található tétel. 
2. A kiegyensúlyozott fáknál jobb teljesítményt nyújtanak olyan alkalmazási hely- 
sodnak". Az ilyen csomós helyzetre suta, de szemléletes példa egy kórház beteg- 
nyilvántartása. (A sutaság abból ered, hogy egy kórházi nyilvántartást külső táron 
érdemes kezelni, míg a bináris keresőfák belső memóriás szerkezetek.) Ha valaki 
bekerül a kórházba, akkor a róla szóló rekord igen aktív lesz; viszonylag gyors 
egymásutánban kerülnek bele a különféle vizsgálatokkal, kezelésekkel kapcsola- 
tos feljegyzések. Ha viszont az illető éppen nem beteg, akkor meglehetősen ritkán 
van szükség erre a rekordra. 








Az §-fák ezen alkalmazkodási képességét egy igen egyszerű, ugyanakkor csil- 
logóan elegáns visszacsatolási mechanizmus biztosítja. Ennek lényege, hogy ha a 
fában tárolt s € U elemmel kapcsolatos elérési igény érkezik (pl. KERES(s, f)), 
akkor az igényt kezelő algoritmus ezt úgy , értelmezi", hogy az s fontossága nőtt. 
Az s elemet alkalmas forgatásokkal a fa gyökerébe mozgatja. Ezen felül az $-hez 
vezető kereső út mentén levő elemek is valamivel fontosabbak lettek; a módszer 
őket is közelíti a gyökérhez. Ennek eredményeként az adott időszakban gyakran 
használt elemek közel lesznek a fa tetejéhez, a kevésbé aktívak pedig lassan a leve- 
lek felé vándorolnak. A gyakran használt elemek ezért nagyon gyorsan elérhetők. 
A kórházi példánál maradva a fa csaknem olyan teljesítményt nyújt, mintha csupán 
az éppen kezelt betegek rekordjaiból állna a nyilvántartás. 





Az S-fák műveleteinek pontos leírásához bevezetünk néhány jelölést. Legye- 
nek f, f" 5-fák, x, y, 2 kulcsok, az U rendezett univerzum elemei. Utóbbiakat azo- 
Nosítani fogjuk az őket tartalmazó fabeli csúcsokkal. Ez nem fog félreértést okozni. 


A keresőfákra jellemző KERES(z, f), BESZÚR(z, f) és TÖRÖL(x, f) mű- 
veleteket a szokásos módon értelmezzük. A RAGASZT(f, f") művelet az f és f/ 
§5-fákból egyetlen 5-fát szervez, feltéve, hogy z € y teljesül minden z € f és 
y € f"/ kulcsra. A VÁG(z, f) művelet szétvágja f-et az f" és f" 5-fákra úgy. hogy 
Sz z teljesül minden ye f és z E f" csúcsra. 





A korábban említett önszervező-szépítő képesség a KIFORDÍT elnevezésű 
eljárásba van építve. Ennek a definíciója az erejéhez képest meglepően egyszerű. 
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KIFORDÍT(r, f) átszervezi az f 5-fát úgy. hogy z lesz az új gyökér, 
haz € f; különben f gyökere x valamelyik szomszédja lesz: 
vagy maxíy € f; y c 2) vagy minfy € főyo zh. 





A KIFORDÍT művelet az egész módszercsalád lelke. Segítségével a többi el- 
járás könnyen megvalósítható: 


Állítás: Az ismertetett műveterek mindegyike megvalósítható konstans számú KI- 
FORDÍT és konstans számú elemi operáció fösszehasonlítás. mutató beállítás, 
stb.) segítségével. 


Bizonyítás: Csak két művelet, a RAGASZT és a TÖRÖL esetét nézzük meg kö- 
zelebbről, A többi módszer összerakását feladatként az olvasóra hagyjuk. 

RAGASZTÍf, f) végrehajtását a KIFORDÍT( 4-oo, f) hívással kezdjük. Itt 
-Hoo € U egy az f minden eleménél nagyobb kuicsot jelent. Legyen £ az eredmé- 
nyül kapott ft fa gyökere. A KIFORDÍT specifikációja szerint az z az f" legna- 
gyobb kulcsa. Ebből következik, hogy r-nek nincs jobboldali fia. Legyen tehát az 
2 jobboldali fia az f" fa gyökere. Az így kapott fára teljesül a keresőfa-tulajdonság. 
mert a hívási feltétel szerint f" kulcsai nagyobbak x-nél. 

TÖRÖLÍr, f) első lépése KIFORDÍT(x, f). Ha az ekkor kapott fa gyökere 
nem x., akkor készen vagyunk: ez azt jelenti, hogy z € f. Feltehetjük ezután, hog; 
afa gyökere x. Legyenek fi és f2 az z gyökér részfái. A törlést RAGASZTÍ( fi, f2) 
végrehajtásával fejezhetjük be. D 











KIFORDÍT(z, f) implementációja 
Hasznos lesz a következő jelölés: legyen z az f fa egy csúcsa, melynek apja y; ez 
esetben FORGAT(g) jelölje azt az egyszeres forgatást, mely r-et y apjává teszi. 

Először a bináris keresőfákban szokásos módszerrel megpróbáljuk megtalálni 
x-et f-ben. Ez vagy sikerül, vagy pedig ha z £ f, akkor az T-nek a rendezés 
szerinti egyik szomszédjánál (maxíy € f; y c Tr) vagy miníy € főv: cp 
végzünk. Mindegyik esetben azt az elemet kell majd felvinnünk a fa tetejére, ame- 
lyet a keresés során utoljára elértünk. Feltehetjük ezért, hogy r € f, és már meg 
is leltük x-et f-ben. 

Ezután a kezünkben levő z elemet az alább következő recept ismételt alkal- 
mazásával felvisszük a fa tetejére. Az eljárásdarab egy végrehajtása maximum két 
szinttel viszi feljebb x-et. Egy menetben a 0-3. lépések közül pontosan egy hajtó- 
dik végre. A döntéshez szükséges ellenőr; önnyű, mert az z-hez vezető kereső 
út utolsó néhány (legfeljebb három) csúcsának és a köztük menő éleknek az isme- 
retében eivégezhető. 
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(0) Ha z gyökér, akkor készen vagyunk. 
(t A továbbiakban jelölje y az x apját. ") 
(1) Ha x-nek nincs nagyapja, akkor FORGAT(2), különben 
(2) ha z és y is baloldali (jobboldali) gyerek, 
akkor FORGAT(y), majd FORGAT(£), különben 
(3) ha z és y különböző oldali gyerekek, 
akkor FORGAT(2), majd ismét FORGAT(2). 











KIFORDÍT(r, f) fontos járulékos hatása, hogy az x kereső útján levő csú- 
csok közelebb kerülnek a fa tetejéhez. A keresőfa-műveletek — a bennük levő 
KIFORDÍT-hívásnak köszönhetően — változtatják a fa alakját. Ez a változtatás 
annál több csúcsot érint, minél mélyebben levő elemre alkalmazzuk a kifordító 
eljárást. 

A következő eredmény a korábban említett 1. tulajdonság pontosabb megfo- 
galmazása. Lényegében azt mondja, hogy egy hosszú műveletsor összköltsége ál- 
landó szorzó erejéig a kiegyensúlyozott fákra jellemző korláton belül marad: az 
egy műveletre eső átlagos költség O(log n), ahol n a fa csúcsainak a száma. A 
bizonyítást mellőzzük. 


Tétel: Egy üres S-fából induló olyan m műveletből álló sorozat költsége, melvben 
n beszúrás van, O(mlogn). D 


3.8. Szófák 


Az eddigi keresőfa-konstrukciók csak annyit tételeztek fel az U kulcshalmazról, 
hogy az rendezett halmaz. A rendező módszereknél a kulcsokról való finomabb 
Ismeretek hatékonyabb algoritmusokhoz vezettek; gondoljunk csak a láda- vagy a 
radixrendezésre. Némiképp hasonló a helyzet a keresőfa-műveleteknél. Bizonyos 
speciális szerkezetű kulcsokra érdekes ad hoc megoldások adhatók. Szép és hasz- 
nos példaként említhetők a szófák. A szerkezet angol neve egy fantáziaszó: trie, 
amely a retrieval szó közepéből való négy betűre szándékozik utalni (kiejtése vi- 
SZOnt a try mintáját követi). 

Legyen E egy véges halmaz, amit úgy tekintünk, mint egy nyelv betűkészletét 
(abc-jét). Jelölje D" a -beli elemekből alkotott véges hosszú sorozatok, azaz sza- 
Vak halmazát, Itt most feltesszük, hogy adott egy rendezés (amit abc-sorrendnek 
tekintünk) a E halmazon. Ebből azonnal adódik egy rendezés Dt-on, nevezete- 
Sen a betűrenden alapuló lexikografikus rendezés. A szófák hatékony keresőfa- 
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konstrukciót adnak arra az esetre, amikor U — X", a rendezés pedig a lexikografi- 
kus. A szófák tehát akkor alkalmazhatók, ha a kulcsok szavak. 


A szófát gyökeres, a gyökértől távolodóan irányított fának képzelhetjük el. 
A fa csúcsai lényegében mutató típusú tömbök, E U (xr) elemeivel indexelve. Itt 
x Z £ egy speciális végjel, amiről feltesszük, hogy a betűrend szerint £ minden 
betűje megelőzi. Úgy is fogalmazhatunk, hogy a tömbök utolsó, [EI -r 1. elemének 
az indexe x. A tömbök elemeiben levő mutatók adják a fa éleit. Egy csúcsnak 
ezek szerint maximum ( E [ I fia lehet. Egy tömbelem vagy NULL (jelezve 
hogy üres, tehát nem tartalmaz igazi mutatót) vagy egy mutató egy fiúra (azaz egy 
másik tömbre) vagy a x végjel. A fában tárolt szavakat gyökértől levélig, azaz a x 
végjelig menő utak jelentik. 

Például ha E a magyar abc, és a KAP szót szeretnénk tárolni, akkor a gyökeret 
jelentő tömb K indexű eleméből mutató mutat egy másik tömbre, ennek A indexű 
elemében mutató van egy további x tömbre, melyre zÍP] — r. Bonyolultabb a hely- 
Zet. ha a KAPU szó is szerepel a szófánkban. Ekkor z(P] valódi mutató, mondjuk 
az y tömbre. Azt a tényt pedig, hogy a KAP szó is szerepel, úgy jelezhetjük, hogy 
x-ot írunk y[r]-ba. Másképpen fogalmazva: a problémát, hogy egyik szó prefixe a 
másiknak — mint a KAP a KAPU-nak - úgy kezeljük, hogy minden szó végére egy 
x-ot képzelünk, és £ csak a szó végén fordulhat elő. Az r(P]-ben gyökerező részfa 
azoknak a tárolt szavaknak felel meg, amelyeknek az első három betűje KAP. 

A tömbök helyett lineáris listák is használhatók. Ezáltal megtakaríthatjuk a 
NULL értékű tömbelemek helyét. Ennél a megközelítésnél viszont némi gondot 
okoz a listák hatékony kezelése. 

Legyen E továbbra is a magyar abc. A KÖR. KÖVÉR, KAPOS, KAP, KALAP 
szavakat tartalmazó fa listás ábrázolása így képzelhető el: 

















Itt egy adott csúcs fiai tekinthetők egy listán levőknek. Így például a gyökér egy 
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egyelemű lista, a második szin 

És itel ő ési 

listát képeznek. n levő A betű fiai, L és P szintén egy (kételemű) 

A szófa adatszerkezet érzél jé eger 

siráltrszávák FÖLKENTÉK a beszúrások sorrendjére, a fa alakj 

igen hatékony. Ugyanis ú FALAT; NAK megvalósított szófában ló kelet 8 
s 8 ő szó hosszáh. § aló keresés 

a mutatók mentén, mi, A oz mérten nei öl 4. 

betűs abc feletti 8 élete külesi a szóban a betűk száma. kk kell többet lépnünk 

vél At Al a . ja 

logm nt c mutató követés éveibé álló szófa esetén a kcsés állagósa HOGY Tt 

8 j sével sződük a osan mi 

állandó. fejeződik, ahol c az m-től és m-től is fuggetlen 

üggetlen 


-elés és szekvenciális keresés 


Hány hajó ütközött itt össze; jóllehet voltak jelzőfényeik, 
kürtjeik és vészharangjaik! JULES VERNE 
(A Nemo kapitány elbeszélőjének 

tűnődése Új-Fundland vizein.) 





Ebben a fejezetben először egy olyan módszercsaládot ismertetünk, amely a kere- 
sés, beszúrás, törlés és módosítás gyors és egyszerű megvalósítását teszi lehetővé. 
A keresőfákhoz képest fontos eltérés, hogy nem tételezzük fel a tehetséges kulcsok 
összességének (az U univerzumnak) a rendezettségét. Ennek megfelelően itt nem 
lesznek rendezéshez kapcsolódó elérési igények. mint pl. a MIN. A célegy SCU 
kulcshalmazzal azonosított állomány megszervezése úgy, hogy a fenti műveletek 
hatékonyak legyenek. A megoldások, amelyekkel megismerkedünk, átlagos érte- 
lemben igen gyorsak. A legrosszabb esetekben viszont nagyon lassúak ís lehetnek. 
Olyan alkalmazásoknál jönnek tehát szóba, ahol az átlagosan jó teljesítmény az 
igazán fontos, és a ritkán előforduló rosszabb válaszidők nem okoznak gondot. 
Először egy rövid példával szeretnénk szemléltetni a hash-elés hátterét, alap- 
ötletét és a felmerülő problémákat. Tegyük fel, hogy magyar állampolgárok ada- 
tait szeretnénk tárolni. Az állomány egy rekordjában olyan adatok (mezők) szere- 
pelhetnek, mint például név, lakcím, személyi szám. stb. A rekordokat azonosító 
külcsként a személyi szám szolgálhat. A személyi szám 11 jegyű, ebből egy re- 
dundáns, és a további ismert korlátozásokat is figyelembe véve (a hónapok száma. 
a hónapok napjainak száma, stb.) mintegy 2-102-12-31.10? sz 74 millió kulcs le- 
hetséges. Ugyanakkor még jó adag demográfiai optimizmus esetén sem kell több, 
mint 11 millió tényleges rekorddal számolnunk a közeljövőben. Nagyvonalúan 
- ami mint később látni fogjuk, hasznos ebben az összefüggésben is — gondolkod- 
hatunk úgy, hogy 12 millió rekord számára foglalunk helyet. Legyen a rekordok 
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(Iogikai) címeinek tartománya a (0, 12. 109 — 1] intervallum egészeinek I halmaza. 
Ezután a feladatot felfoghatjuk úgy is, hogy egy olyan megfeleltetést keresünk, 
mely minden kulcshoz egy cítet rendel. Olyan h függvényre gondolunk, amelynek 
az értelmezési tartománya a lehetséges kulcsok halmaza, értékkészlete pedig 7, a 
logikai címek tartománya. Kényelmes volna, ha K 7 K" esetén h(K) A h(K") 
teljesülne. Ez azonban képtelenség, hiszen az értelmezési tartomány jóval na- 
gyobb, mint az értékkészlet, ezért h nem lehet injektív. Az ilyen ütközések tehát 
elkerülhetetlenek. Sőt, bizonyos értelemben elég gyakran előfordulnak. Erre vilá- 
gít rá a születésnap-paradoxon (szokás még von Mises-paradoxonnak is nevezni): 
egy legalább 23 tagú társaságban legalább 1/2 valószínűséggel van két személy, 
akiknek megegyezik a születésnapjuk. Általában megmutatható, hogy ha a h függ- 
vény értékkészlete M elemű, akkor V21n2- M véletlenül választott argamentum 
között legalább 1/2 valószínűséggel lesz kettő, melyre h ugyanazt az értéket adja. 
E tény azt sugallja, hogy jó esély van ütközésre még akkor is, amikor címtartomány 
méretéhez képest viszonylag kevés rekordunk van a tárolt állományban. 

A hash-elés vagy hash-kódolás módszerét használó tárolási technikák alap- 
vető közös vonása, hogy egy alkalmas h függvény, az úgynevezett hash-függvény 
segítségével kísérlik meg kiszámítani a beillesztendő rekord (logikai) címét. A h 
függvény a K kulcshoz a h(.K) címet rendeli. A módszerek első közelítésben a K 
kulcsú rekordot a h(K) címnek megfelelő helyre próbálják tenni. Ez nem lehetsé- 
ges ütközés esetén: amikor egy másik K" rekord érkezik, melyre h(K) — h(K?). 
A teendők fontos része éppen ezért az ütközések feloldása. Olyan megoldások- 
ról van itt szó, amelyek ütközéskor helyet találnak a később jött rekordoknak. Az 
egyes módszereket az ütközések kezelése alapján szokás osztályozni. Ezt tesszük 
mi is, 

A másik alapvető kérdést a megfelelő hash-függvény találása, kiválasztása je- 
lenti. Olyan könnyen számítható h függvényeket keresünk, amelyek az alkalmazás 
során felmerülő kulcshalmazokon minél kevesebb ütközést okoznak. Ennek a mi- 
kéntjeivel is foglalkozunk. 

A szekvenciális kereséssel már találkoztunk a rendezések tárgyalásakor. Ott 
rendezett állományokban való keresésre használtuk a módszert. A fejezet végén 
ejtünk néhány szót arról az esetről, amikor az állomány nem feltétlenül rendezett. 





4.1. A hash-elés alapjai 


Két igen szerteágazó módszer legegyszerűbb változatait ismertetjük. Ezek a vöd- 
rös hash-elés és a nyitott címzés. Az első technikát, a vödrös hash-elést elsősorban 
külső táron levő nagyméretű állományok kezelésére használják. Szinte minden ko- 
moly adatbáziskezelő rendszer ad ilyen jellegű tárolási lehetőséget. A nyitott cím- 
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zésű módszerek ezzel szemben főleg a belső memóriában levő állományok gyors 
kezelését hivatottak biztosítani. Jellegzetes alkalmazásként említhetjük a progra- 
mok fordításakor keletkező szimbólumtáblák kezelését vagy a később bemuta- 
tandó Lempel-Ziv-Welch-módszer szótárának a tárolását. 

A továbbiakban mindkét esetre érvényesen feltesszük, hogy van egy A hash- 
függvényünk, amely a K kulcshoz a h(.K ) logikai címet rendeli. A h(.K ) cím egy 
egész a [0, M — 1] intervallumból. Azért beszélünk fogikai címekről, merta h(K) 
értékek többnyire nem jelentenek tényleges fizikai helymegjelöléseket. Ugyanak- 
kor feltehetjük, hogy a rendszer biztosít egy mechanizmust, amely a (0, M — 1] 
intervallum egészeit a tényleges adatmozgatást végző réteg számára értelmezhető 
címekké fordítja. 


4.1.1. . Vödrös hash-elés 


A módszert szokásos láncolásnak is nevezni. Lényeges eleme a V(0 : M — 1] 
vödörkatalógus. Amínt a jelölés is sugallja, V-t hasznos egy a h értékkészletének 
elemeivel indexelt tömbnek elképzelni. A kép nem teljesen hűséges, mert V nagy 
is lehet. Előfordulhat, hogy részben vagy egészében háttértáron kell elhelyezni. A 
V elemei mutatók, pontosabban lapláncok fejei. A lapláncokat szokás vödröknek 
nevezni. A vödrök lapjain helyezkednek el a tárolni kívánt rekordok. Nevezetesen 
a V[í) mutatóval kezdődő vödörbe kerülnek azok a rekordok, amelyek K kulcsaira 
h(K) — i teljesül, 


Vegyük szemügyre ezután a szerkezet algorítmusait! Tegyük fel, hogy a K 
kulcsú rekordot akarjuk beilleszteni. Először kiszámítjuk a h(.K) értéket, majd 
megnézzük a vödörkatalógus /(h(K )) bejegyzését. Ez egy mutató arra a vödörre 
(lapláncra), melyben a h( K) hash-értékű rekordokat kívánjuk tárolni. A vödör ál- 
talában egy kicsi, legfeljebb néhány lapból álló állomány. Ebben elhelyezzük a 
tárolni kívánt rekordot. A következő ábrán a V vödörkatalógust függőleges hely- 
zetben mutatjuk; a vödrök a lapokból álló vízszintes sorok. 






































0 HI 3 ! 
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NM egy vödör lapjai 
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A rekordnak a vödörben való elhelyezése több módon is történhet. Gyakran 
használatos és egyszerű megoldás, hogy a rekordot az első szabad helyre tesszük. 
Ha szükséges, új lap hozzáfűzésével bővítjük a láncot. Másik szokásos eljárás, 
hogy a rekordokat kulcs szerint rendezve tartjuk a vödörben. Ekkor — a beszúrá- 
sos rendezésnél tapasztaltakhoz hasonlóan — előfordulhat, hogy több rekordot is 
mozgatni kell a vödrön belül. 

A keresés módszere ezek után nyilvánvaló. A K kulcsú rekord keresése avval 
kezdődik, hogy kiszámítjuk a h(X) értéket. Ha a rékord a tárolt állományunk- 
ban van, akkor csak a V[R(KI) mutatótól induló vödörben lehet. Ezután tehát a 
vödörkatatógus VIA(K)] mutatóját követve a vödör első lapjára lépünk. A vö- 
dörben szekvenciális kereséssel dolgozhatunk. Addig megyünk a laplánc mentén, 
amíg vagy megtaláljuk a rekordot, vagy pedig kiderül, hogy az nincs a tárolt ál- 
tományban. A törléssel és a módosítással kapcsolatos teendők a keresés után már 
kézenfekvőek, így nem részletezzük őket. Csak annyit jegyzünk meg, hogy ha a 
módosítás a kulcsot is érinti, akkor törlés, majd újbóli beillesztés válhat szüksé- 
gessé, hiszen a kulcs módosulásával annak h-értéke is változhat. 

A vödrös hash-elés kitűnően alkalmazható külső tárakon elhelyezkedő állomá- 
nyok kezelésére. A módszer ötlete jól illeszthető a használt fizikai tárolási médium 
sajátosságaihoz. A vödrök gyakran megvalósíthatók a lapláncnál alacsonyabb, ha- 
tékonyabb szinten. Egy vödör lehet pl. a mágneslemez egy sávja (track) vagy an- 
nak írás/olvasás szempontjából folytonos része. Iyenkor az utolsó sáv szolgálhat 
a túlcsordulások kezelésére; 


Mi mondható a módszer költségéről? Mivel külső táras adatszerkezetről van 
szó, a lapelérések számát kell vizsgálnunk. Ezt szem előtt tartva világos, hogy a 
láncolási módszer időigényét (költségét) a lapláncok hossza határozza meg. Te- 
gyük fel, hogy M vödör van, és [-lapnyi rekordot tárolunk. Ekkor egy vödörbe 
átlagosan sz [/M lap kerül. Ennyi lesz tehát az átlagos lánchossz. Ha a keresés 
során minden vödörhöz ugyanakkora eséllyel fordulunk, akkor a keresés átlagos 
költsége legfeljebb 1 -- 1/M lapelérés. Itt azzal a feltételezéssel éltünk, hogy a 
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vödörkatalógus is háttértáron helyezkedik el, és VIh(.K)) olvasása egy lapelérésbe 
kerül. Az átlagszámításban hallgatólagosan feltettük még azt ís, hogy a h függvény 
elég egyenletesen szórja szét az érkező kulcsokat a (0, M — 1) intervallumban. 

A módszer alkalmazása előtt fontos méretezési feladat a katalógus elemszá- 
mának. az M paraméternek a meghatározása. Általában ismerjük (esetleg csak kö- 
zelítőleg) a tárolni kívánt állomány nagyságát kifejező ! értéket. Ennek birtokában 
az M értékét célszerű úgy választani, hogy a várható !/M hányados közel legyen 
1-hez. Nem szokatlan a 20 százalékos rátartás, vagyis többlethely lefoglalása sem. 


Példa: Tegyük fel, hogy egy maximum 1 000 000 rekordból álló állományt sze- 
retnénk láncolásos módszerrel kezelni. Tegyük fel, hogy egy lapon 5 rekord fér el. 
Ekkor / — 1 000 000/5 — 200 000. Az M paraméter értékét 220 000 — 240 000 
körülinek érdemes választani. Ha a katalógus elemei is diszken vannak, és egyen- 
ként elérhetők 1 lépésben, akkor a keresés átlagos költsége valamivel 2 lapelérés 
alatt marad. 


Végezetül megemlítjük, hogy a láncolás módszere belső memóriás megoldás- 
ként is versenyképes. Az előbbiekhez viszonyítva az eltérés annyi, hogy itt nem 
lapokat, hanem rekordokat láncolunk. Egy vödör tehát egy rekordokbál álló láncot 
jelent. 


4.1.2. Nyitott címzés 


A nyitott címzést használó módszerek általában — az itt bemutatásra kerülő tech- 
nikák pedig különösen is — csak belső memóriás módszerként hasznosak. A re- 
kordokat a T(0 : M — 1] táblában (tömbben) kívánjuk elhelyezni. A T tömböt 
tehát a A függvény értékkészletének elemeivel, a (0, AM — 1] intervallum egészeivel 
indexeljük. A T elemei pedig rekordok. A K kulcsú rekordnak a T(A(K))] helyet 
szánjuk, feltéve, hogy az nem foglalt. 

Ellenkező esetben, amikor a TIR(K)] cellában már egy korábban beillesz- 
tett rekord van, akkor valamilyen szisztematikus módon próbálunk helyet ke- 
resni a T további celláiban. A nyitott címzésű módszerek ütközésfeloldásra a 
0,1 , M —1 számok egy 0, h1( K), ho( K), . . . hm -1(K) permutációját hasz- 
nálják. Pontosabban fogalmazva sorra végigpróbáljuk a h(.K) 3 h;(.K) sorszámú 
cellákat (i — 0,1,..., M — 1) az első üres helyig, ahol a rekordot elhelyezzük. 
Itt az összeadás modulo M értendő, vagyis az összeg mindig 0 és M — 1 közötti 
egésznek vehető. Permutációra azért van szükség, hogy a h(K) 4 h;(K) sorszámú 
cellák kiadják a tábla minden helyét. Ha nem találtunk üres helyet a sorozat men- 
tén, akkor arra következtethetünk, hogy a tábla betelt, az új rekordot már nincs 
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hová tenni. A h;(.K) számok jelölésében azért tüntettük fel K-t, hogy érzékeltes- 
sük: a próbasorozat függhet a kulcstól is. 








FESZES TATA 


0 HK) h(K)-hi(K) h(K) hol) h(K) 4-ha(K) M-1 




















Az előző bekezdésben tulajdonképpen elmondtuk a beillesztés algorítmusát. 
A keresés itt is egyszerű. Ha a keresett rekord kulcsa K , akkor sorra megnézzük 
a h(K) 4 h:(KK) sorszámú cellákat (í — 0,1, . . .), amíg megtaláljuk a keresett 
rekordot, vagy üres cellához érünk, vagy pedig é — M — I. Az utóbbi két esetben 
a keresett rekord nincs a táblában. 

A törlés érdemi része is világos ezután. Megkeressük az eltávolítandó rekordot, 
majd töröljük a táblából. Ez utóbbi fázis a szokásosnál több körültekintést igényel. 
Később egy példa kapcsán még foglalkozunk ezzel a kérdéssel. 

A módszerek összehasonlításához, hatékonyságuk elemzéséhez hasznosak 
lesznek a következő jelölések: 


N - a táblában levő rekordok száma 

M - a tábla celláinak száma 

az § — a telítettségi (betöltöttségi) tényező 

CN - a sikeres keresések (amikor a keresett rekord megtalálható T-ben) során 
megvizsgált cellák átlagos száma 

CN" - a sikertelen keresések (a keresett rekord nincs T-ben) során megvizsgált 
cellák átlagos száma. 


A Cw meghatározásában az , átlagos" úgy értendő, hogy a táblában levő mind- 
egyik elemre egyenlő eséllyel érkezik keresési igény. A CN" esetében pedig arról 
van szó, hogy a h(.K) érték ugyanakkora eséllyel lehet a 0, 1, . . . , M — 1 számok 
bármelyike. Mindeme előkészületek után lássunk néhány fontosabb próbamód- 
szert; 


Lineáris próbálás 

It (KK) :— —i, A K kulcsú rekord beillesztése során a h(K ) című cellától in- 
dulva addig lépkedünk egyesével balra, amíg üres helyet nem találunk. A T(0] cella 
után pedig, ha kell, a TIM —1)] cellával folytatjuk. A keresés költségére érvényesek 
A következők (nem bizonyítjuk): 
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1 1 
Cx-3 (153) 


evzz (1 (3) ) 


Néhány a értékre táblázatba foglaltuk a formulákból adódó keresési időket. 
Látható, hogy 80 százalékos telítettség felett a sikertelen keresések már elég sok 
időt igényelnek. 


és 




















a 12/3108] 09 
Cxi] 213 0]55 
ml 5 ] 13 505 








Példa: Tegyük fel, hogy a kulcsok természetes számok, és a rekordjaink csak eb- 
ből az egyetlen mezőből állnak. Legyen a táblaméret M — 7, és legyen a hash- 
függvény h(K) : K (mod 7). Tegyük fel még azt is, hogy az ütközések fel- 
oldására lineáris próbálást használunk. Így néz ki a tábla a 3, 11 és 9 kulcsok 
beillesztése után: 


2 4 ölt ERB - zt Eölg. EE St: ! 
[e ELERES GE] 
Ha most a K — 4 kulcsot szeretnénk beilleszteni, akkor mivel a T[4]. T(3] és 


TIZ] helyek is foglaltak, hármat kell lépnünk a próbasorozat mentén. A négyes a 
TT1]-be kerül: 


























0 12 30456 
4AJ9J3[ulI[] 























Töröljük most a 9 kulcsot. Első gondolatunk az lenne, hogy a sikeres keresés 
után felszabadítjuk a T[2] helyet ugyanolyan NULL értéket adva neki, mint ami a 
még üres T [0], T(5] és T(6] cellákban van. Ez azonban bajt okozhat, hiszen ezután 
a K — 4 kulcs keresése sikertelen lenne. A próbasorozat mentén NULL értékű cel- 
lához jutnánk, amiből azt hihetnénk, hogy a négyes nincs a táblában. A megoldás 
egy a NULL-tól különböző TÖRÖLT jei használata (ez lehet pl. x). A keresések 
során ezek a cellák átléphetők; úgy tekinthetjük őket, mintha foglaltak volnának. 
Új rekord beillesztésekor természetesen egy ilyen hely üresnek tekinthető, és ismét 
használható. A törlés után a helyzet tehát így alakul: 
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0 1 2 3 4 5 6 
Cel -I3[ULT] 


Ezután már nem lesz baj, amikor a négyest keressük. A T(2]-ben levő x jelből 
tudni fogjuk, hogy tovább kell lépnünk a próbasorozat mentén. A törléssel kap- 
csolatban itt vázolt probléma általános a nyitott címzést használó módszereknél, A 
javasolt megoldás, a TÖRÖLT jel használata, működik más próbasorozatok esetén 




















18. 

A példa egyébként mutatja a lineáris próbálás fő hátrányát is. Ha sok rekord 
van a táblában, akkor hosszú, egybefüggő . csomók" alakulnak ki, megnövelve a 
keresési utak hosszát. Mondjuk a 18 keresésekor elég nagy utat kell megtenni, 
mire kiderül az igazság. Ezt a kellemetlen jelenséget elsődleges csomósodásnak 
(klasztereződésnek) szokás nevezni. A csomósodás oka abban van, hogy ha egy 
R! rekord beillesztése során elérjük a már tárolt R rekord keresési útját, akkor azt 
rendszerint végig is kell járnunk. 

A lineáris próbálással ismerkedők gyakran kérdezik, hogy miért visszafelé lép- 
kedünk a táblában, és nem előre. A magyarázat programozástechnikai természetű. 
Az eljárásokban (sokszor) ellenőriznünk kell, hogy a lépkedés során nem értük-e 
el a tábla végét. Ha visszafelé, a tábla eleje felé megyünk. akkor a nullával való 
egyenlőséget kell vizsgálni; ha a másik irányt választanánk, akkor egy M körüli 
egész szerepelne a tesztekben. Az előbbi típusú tesztek időigénye jóval kisebb, 
amitől a visszafelé lépkedő kód számottevően gyorsabb az előre menőnél. 





Álvéletlen próbálás 

Ezeknél a módszereknél a 0,hi(K),ho(K),...,hm-1(K) próbasorozat a 
0,1,..., M — 1 számoknak egy a K kulcstól független álvéletlen permutációja. 
A sorozatnak természetesen gyorsan és hatékonyan reprodukálhatónak kell lennie, 
hiszen minden adatelérési műveletnél használni akarjuk. Ez a kikötés éppenséggel 
ellentétes a véletlenszerűséggel. Másfelől viszont ha a sorozat eléggé , véletlen- 
szerű", elég szeszélyesen ugrabugrál, akkor a táblában nem tapasztalunk elsődle- 
ges csomósodást. A két törekvés egymással ellentétesnek tűnik. de mint példák 
mutatják, összebékíthetők. 

Az álvéletlen próbálás sem mentes teljesen a csomósodástól, bár ez kisebb 
mértékben rontja a hatékonyságot, mint a lineáris próbálásra jellemző elsődleges 
csomósodás. Arról van szó, hogy ha a K és L kulcsokra h(K) — R(L). akkor a 
K és L kulcsok teljes próbasorozata is megegyezik. Ha tehát sok azonos címre 
kerülő kulcs van, akkor a közös próbasorozatuk mentén alakul ki csomósodás. Ezt 
a jelenséget másodlagos csomósodásnak nevezzük. 

Az álvéletlen próbálásra egy hasznos és mutatós példa a kvadratikus maradék 
próba. Legyen M egy 4k -- 3 alakú prímszám, ahol k egy egész. Ekkor a próbaso- 
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rozat legyen 


mene). (EZ-E 








Egy kis számolgatás (az M — 19-et javasoljuk az olvasónak) érzékelteti, hogy a 
sorozat tényleg elég szeszélyesen lépked. Elméleti érvek is szólnak a , véletlensze- 
rűsége" mellett: ezeket most mellőzzük. Megmutatjuk viszont, hogy a sorozat a 
modulo M maradékosztályok egy permutációját adja. Ez könnyen következik az 
alábbi tényből. 





ÁMítás: Ha M egy 4k 4 3 alakú prúnszám, akkor nincs olyan n egész, melyre 
n?z-1 (mod M). 


Bizonyítás: Indirekt érvelve tegyük fel, hogy n egy egész szám és n? z -1 
(mod M). Ekkor 





-1z 


1 (mod M). 


Az utolsó lépésnél a kis Fermat-tételt használtuk. Az elejét a végével összevetve 
-15E1 (mod M) adódik. ami képtelenség. CI 


Nyilvánvaló mármost, hogy ha0 £ i € j S 5, akkori? éj? (mod M). 
Ugyanis a j? — 12 — (j — i)(j 4 í) felbontás egyik tényezője sem lehet osztható 
M-mel, tehát a szorzatuk sem. Ugyanígy kapjuk, hogy —i? 2 —j? (mod M). 
Az z —j? (mod M) kongnienciából pedig (ij-!)? 5 -1 (mod M) kö- 
vetkezne, ahol j7! jelöli a j multiplikatív inverzét modulo M. Ez a kongruencia 
pedig az előző állítás szerint nem lehetséges. A próbasorozatban tényleg nincs is- 
métlődés. 





Ami a keresés költségét illeti, a legjobb változatok időigénye így alakul (nem 
bizonyítjuk): 


Cw51-log(1—- a) 5 


a sikeres keresésre, és 


Cs — a — log(1 — a) 


1 
(1- a) 
a sikertelen keresés során megvizsgált cellák átlagos számára. Ezek az össze- 
függések valamivel általánosabban érvényesek az olyan módszerekre, amelyekre 
hu(K) — f(R(K)): vagyis ahol a h(K) érték már az egész próbasorozatot meg- 
határozza. 
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Kettős hash-elés (G. de Balbine, J. R. Bell, C. H. Kaman, 1970 körül.) 
A recept lényege, hogy a h mellett egy másik A" hash-függvényt is használunk, 
utóbbival szemben követelmény, hogy a h"(K) értékek relatív prímek legyenek 
az M táblamérethez. A K kulcs próbasorozata ekkor h;(X) —ih(K). Ha 
M és h(K) relatív prímek, akkor a 0,—h"(K),—2n"(K), .. (M — Dh(K) 
sorozat elemei mind különbözők modulo M, így alkalmas lesz próbasorozatnak. E 
módszerek fontos s; ssága, hogy a különböző K és K" kulcsok próbasorozatai 
jó eséllyel akkor is különbözők lesznek, ha A(K) — A(K"). A legjobb ismert 
implementációk időigénye (empirikus adatok alapján) 

1 NNAETTNÉK 
GEN ENTETTS 

A kettős hash-elés hatékony, a gyakorlatban is jó viselkedést mutató módszer, 
Ezzel kapcsolatos további tapasztalati észrevételek a következők: 
1. A kettős hash-elés kiküszöböli mindkétféle csomósodást. 
2. Sikertelen keresés esetén minden érdekes a-ra gyorsabb, mint a lineáris próbá- 
lás. 
3. Sikeres kereséskor csak az a 2 0,8 tartományban lesz gyorsabb a lineáris pró- 
bálásnál. 














1 
CN Sz a 108 


Végezetül bizonyítás nélkül megemlítünk néhány tényt a vödrös hash-elés 
belső memóriás változatáról. Ekkor rekordokat (cellákat) láncolunk. Egy vödör te- 
hát cellákból álló lánc lesz. Jelölje M a vödörkatalógus méretét. Tegyük fel, hogy 
a rekordok a kulcs szerint nem csökkenő sorrendben vannak a listájukra fűzve. 
Ekkor igazolható, hogy ha 0 c a c 1, akkor 

Cusz14za és Ciysz1a5oZ. 

A láncolás általában jóval helyigényesebb a nyitott címzésű módszereknél. A 
megvizsgált cellák számát tekintve — ezt mérik a Cy és CN mennyiségek — viszont 
hatékonyabb azoknál mind a sikeres, mind a sikertelen kereséseket illetően. Valódi 
időben mérve az összevetés már nem ennyíre egyértelmű, mert a listák kezelése 
nehézkesebb, mint a tömbszerű tábláké. 

Feladat: Igazoljuk a belső memóriás láncolás sikeres keresésének idejét megadó 
formulát. 


4.2.  Hash-függvények 


A hash-elést használó módszerek hatékonysága nagymértékben függ a A hash- 
függvény minőségétől. A A függvénnyel szemben két alapvető követelmény van: 
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legyen könnyen (gyorsan) számítható, és minél kevesebb ütközést okozzon. 

Az első követelmény magától értetődő: a módszer alkalmazása során minden 
rekordelérés egy h(.K) érték kiszámítása alapján történik, ahol K egy kulcs. 

A második követelmény elég nehezen megfogható, mert a gyakorlatban előfor- 
duló kulcshalmazok egyáltalán nem véletlenszerűek (a fejezet elejének példájához 
kapcsolódva mondjuk a Kovács név sokkal gyakoribb, mint az Eördögh). Kevés 
elméleti eredmény van, viszont jelentős tapasztalati hátterű ismeret halmozódott 
fel. Ilyen hasznos empirikus tanácsok például, hogy h(KK) értéke lehetőleg a K 
kulcs minden bitjétől függjön, és a kh értékkészlete a teljes [0, M — 1) címtarto- 
mány legyen. Fontosságát tekintve két módszer emelkedik ki a mezőnyből. Ezeket 
ismertetjük a következőkben. 


Osztómódszer 

Legyen h(K) : K (mod M), ahol M a tábla vagy a vödörkataiógus mérete. [tt és 
a továbbiakban is feltesszük, hogy a kulcsok egész számok. Ez nem jelent lényegi 
korlátozást. A gyakorlatban előforduló kulcsok általában könnyen és gyorsan kon- 
vertálhatók egészekké. Legtöbbször arról van szó, hogy valamilyen bitsorozatot 
számként értelmezünk. A h(K) szám; gyors és egyszerű: mindössze egy ma- 
radékos osztást igényel. A lineáris próbálásnál szereplő példában az esztómódszert 
alkalmaztuk. 

Az osztómódszer használatakor M, a tábla mérete sem teljesen közömbös. Pél- 
dául ha M a 2 egy hatványa, akkor k( K ) csak a kulcs utolsó néhány bitjétől függ. 
A jó M értékeket illetően van egy széles körben elfogadott recept, amit a szakma 
D. E. Knuth javaslataként tart számon. Eszerint megfelelő, ha M-et prímnek vá- 
lasztjuk, úgy, hogy M nem osztja rf--a-t, ahol r a karakterkészlet elemszáma (pl. 
128, vagy 256) és a, k , kicsi" egészek. 

Az, hogy M prím, lényeges feltéte! a kvadratikus maradék próbánál. Ugyan- 
csak előnye az ilyen számoknak, hogy könnyű hozzájuk relatív prím számot ta- 
lálni. Az utóbbi tulajdonság a kettős hash-elésnél jut szerephez. 











Szorzómódszer 
Ennél az eljárásnál egy rögzített 8 paraméter használatos, ami egy valós szám. 
Ennek birtokában legyen 


h(K) :— IM - (8K) I. 
A formulában íz) jelöli az z valós szám törtrészét. Szemléletesen az történik, 


hogy (8K) kiszámításával a K kulcsot , véletlenszerűen" belőjük a (0, 1) inter- 
vallamba, majd az eredményt felskálázzuk a címtartományba. 
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Hatékonyan számítható speciális eset a következő: legyen a táblaméret 
M - 27, jelölje w a gépünk szókapaci (pl. w — 2??), és legyen A egy a w-hez 
relatív prím egész. Ekkor 8 — 4 választás mellett h(K) igen jól számolható. A 
számok bináris ábrázolásával dolgozva lényegében egy szorzást és egy eltolást kell 
elvégezni. 

A szorzómódszer (és az osztómódszer ís) jól viselkedik számtani sorozato- 
kon, azaz (K,K -- d, K 7 2d,...) alakú kulcshalmazokon. Ilyenek könnyen 
adódnak gyakorlati adatkezelési feladatokból, amint azt a termékI, termék2, ter- 
mék3, . . . és a hasonló szerkezetű kulcshalmazok mutatják. Megmutatható, hogy a 
h(K) h(K4-d), h(K--2d) . . . sorozat közelítőleg számtani sorozat lesz, azaz h jól 
, szétdobja" a kulcsok számtani sorozatait. Ennek a ténynek szép elméleti háttere 
van. Tegyük fel, hogy 8 egy irracionális szám, és nézzük a0, (8), (28). . . . , (n8) 
sorozat eloszlását [0,1)-ben. Nagy n értékre ez egyenletes: egy z hosszúságú 
(0 c z c 1) részintervallumba körülbelül zn elem esik, han — c0. Ez adódik az 
alábbi csodaszép eredményből. 






Tétel (T. Sós Vera, 1957): Legyen 8 irracionális szám, és nézzük a 0, (8) 
(28) ,.... (n8) pontok által meghatározott n -- 1 részintervaliumot (0, 1)-ben. 
Ezek hosszai legfeljebb 3 különböző értéket vehetnek fel, és ((n 4 198) a leg- 
hosszabbak egyikét fogja két részre vágni. D 


Ismert még, hogy a (0, 1)-beli számok közül a legegyenletesebb eloszlást a 
87 $7! — 45 — 0.618033988 . . . ésa 8 — 67? — 1— 67! értékek adják. Ek- 
kor ha ((n -- 1)6) a korábbi osztópontok által meghatározott / részintervailumba 
esik, és azt a, valamint b hosszúságú részekre osztja, akkor : a § c ? mindig 
teljesül. Eszerint érdemes a szorzómódszernél az A egészet úgy választani, hogy 
4 közel legyen $7!-hez. A 8 ilyen választásával kapott módszereket Fibonacci- 
hash-elésnek nevezzük. 


A kettős hash-elés második függvénye 

A kettős hash-elésnél olyan Ah" függvényre van szükség, melynek értékei a 
(0, Mt — 1] intervallumba esnek, és relatív prímek az M tábtamérethez. Ha M 
prím, akkor a következő függvény megteszi: 


h(K) :— K (mod M—1) 4-1. 
Az első tag 0 és M — 2 közé eső egész, ezért a h" értékei 1 és M — 1 között lesz- 
nek, sőt az értékkészlete éppen az (1, M — I) intervallum egészeiből áll. Ebből két 


hasznos dolog következik. Egyrészt az, hogy h"(I) és M relatív prímek. Másrészt 
az is teljesül, hogy elég sok — szám szerint M — 1 — különböző próbasorozatot ad. 
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4.3.  Hash-elés kontra keresőfák 


Két erőteljes és gazdag módszercsaládot ismertünk meg a keresés, beszúrás, törlés 
és az ezekre épülő műveletek megvalósítására; divatos kifejezéssel élve: dinamikus 
halmazok kezelésére. Az egyik megközelítés a hash-elt szervezés, a másik pedig 
a keresőfa adatszerkezet. Természetesen vetődik fel a kérdés. hogy milyen szem- 
pontok szerint válasszunk a kettő közül. Ez felmerülhet úgy, hogy nekünk kell egy 
dinamikus halmazokat kezelő programot írni, de úgy is, hogy egy készen kapható 
rendszer (pl. adatbáziskezelő) által nyújtott lehetőségek közül kel! választani. Há- 
rom szempontot említünk, amelyek segítenek az elígazodásban. 





Átlagos viselkedés — legrosszabb eset 

A hash-elt szervezésnél az alapműveletek (keresés, beszúrás, törlés) átlagos érte- 
lemben gyorsabbak, mint a keresőfáknál. Ezt tükrözi az a tény, hogy a hash-elésnél 
rögzített a c 1 telítettségi tényezőnél a megvizsgált lapok, illetve cellák száma 
átlagosan konstans korlát alatt marad. Számos alkalmazásnál éppen az átlagos se- 
besség. ami igazán számít. Például az ügyviteli alkalmazások egy jelentős részénél 
csak az a fontos, hogy nagy mennyiségű teendőt összességében kedvező idő alatt 
elvégezzünk, és nem érdekes, ha ezek közül néhány hosszabb ideig tart, mint a 
többi, Az ilyen esetekben a hash-elés felé billen a mérleg nyelve. 

Vannak ezzel szemben olyan helyzetek, ahol a legrosszabb, legkedvezőtlenebb 
esetekben is elég gyorsnak kelt lenni. A legdrámaibb példák ebből a szempontból 
az ún. valós idejű feladatok. Ezek jellemzője, hogy a programnak meg kell fe- 
lelnie valamilyen külső folyamatok feszített időbeli kényszereinek. Mondjuk egy 
erőmű kazánjának szelepeit vezérlő rendszertől elvárjuk, hogy a megnövekedett 
hőmérsékletre még azelőtt reagáljon, nyissa ki a szelepeket, mielőtt szétrobban a 
kazán. Groteszk lenne a katasztrófa után azzal takarózni, hogy a program éppen 
egy hosszú vödörben kotorászott valami adat után. Az ilyen körülmények között 
adódó dinamikus halmazokat keresőfákban kell tárolnunk, mert azok a legrosszabb 
esetek idejére is garanciát nyújtanak. 








Rendezés a felhasználói igényekben 

Előfordul, hogy az adatok rendezésére vonatkozó feltételek komoly szerepet ját- 
szanak a felhasználói igényekben, például sok MIN, MAX, és/vagy TÓLIG-típusú 
kérdésre kel! válaszolni. Ekkor a keresőfák ajánlhatók, hiszen jó megoldásokat 
nyújtanak az ilyen feladatokra. A hash-elt szervezések nem, vagy csak meglehető- 
sen bonyolult kiegészítő megoldásokkal tudják figyelembe venni a rendezettséget. 
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pinamika 

A hash-elt szervezés nem támogatja az állomány nagyon dinamikus növekedését. 
Ha a tábla betelik, vagy ha a már túl nagy, akkor új, nagyobb táblával (vödörka- 
talógussal) újra kell szervezni az állományt. A keresőfák ezzel szemben rendkívül 
rugalmasan, tág határok között tudják változtatni a méretüket. Ha tehát úgy lát- 
juk, hogy a tárolandó állomány mérete erőteljesen változni fog, vagy nem tudunk 
a méretre realisztikus felső korlátot adni, akkor inkább a keresőfák ajánlhatók. 


4.4. Szekvenciális keresés 


Gyakran előfordul, hogy egy állomány (tömb, lista, stb.) szegényes szerkezetű. Ez 
alatt azt értjük, hogy nincs benne elég rendszer, és ezért a keresésre nincs jobb 
módszerünk, mint a szerkezetet , elejétől a végéig" bejárni, vagy legalábbis addig, 
amíg a keresett adatot meg nem találjuk, Az ilyen esetekben szekvenciális keresés- 
ről beszélünk. A modell, amit használunk, a rekordokból álló tábla. 


A feladat az R rekord megtalálása a táblában. ha egyáltalán benne van. A kere- 
sés úgy történik, hogy a tábla elejétől kezdve sorra összehasonlítjuk az R rekordot 
az R; rekordokkal (i sz 1, 2, . . .). A keresés befejeződik, ha R — R;, vagy í s N. 
A keresés költsége a tábla megvizsgált celláinak száma. 

Ha semmiféle további feltevéssel nem élünk, akkor a sikeres keresés átlagos 
költsége 











142----4N  N-1 
N 72 


Az átlag úgy értendő, hogy az R — R; események egyenlő esélyűek. Sikertelen 
kereséskor, amikor az R rekord nincs a táblában, a költség mindig N. 

Ha a tábla a rekordokat egyértelműen meghatározó kulcs szerint rendezett, ak- 
kor sikeres keresésnél a helyzet változatlan, sp az átlagos költség. A sikertelen 
keresés időigénye csökkenhet, hiszen a táblát csak akkor kell végignézni, ha R 
kulcsa nagyobb az Rw kulcsánál. Beszélhetünk átlagos költségről is: a beszúrá- 
Sos rendezés elemzésében használt feltételhez hasonlóan tegyük fel, hogy az R 
egyenlő eséllyel kerül az R; rekordok által meghatározott N -k 2 rendezési inter- 
vallum bármelyikébe. Ekkor a megvizsgált cellák átlagos száma 





132-4-4N-LENEN NN ON 


s 4 
N-$d 2 Ni1 :t 
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Tegyük fel a továbbiakban, hogy csak sikeres keresésekkel van dolgunk, és 
legyen p; annak a valószínűsége, hogy az R; rekordot keressük, Ekkor pi -- p2 -k 
"""-tpnN— l, és a keresés várható költsége 


Cn — pid 2p2t3pz tt Npw. 


Feladat: Mutassuk meg. hogy adott valószínűségek mellett Cw akkor minimális, 
hapi 2 pe2...2 pn.(Hai c jés pi c pj, akkor az R; 6 R; csere után Cy 
kisebb lesz.) 

A feladat szerint a rekordokat a keresési gyakoriságok szerint nem növekvő 
sorrendben érdemes a táblában tartani, Előfordul, hogy a (pi) eloszlást, vagy an- 
nak elég jó közelítését ismerjük, és ezért ki tudjuk alakítani az optimális sorrendet, 
Olyan alkalmazásoknál fordul ez elő, ahol a tábla statikus, a tartalma nem válto- 
úk, és kizárólag keresési igények merülnek fel. iyen alkalmazásra elég jó példa 
egy archív szövegeket (mondjuk régi folyóiratok tartalmát) tároló rendszer. Néz- 
zük meg ezután, hogy miként alakul a CN értéke néhány érdekes eloszlás esetén, 
amikor a rekordok a p; értékek szerint nem növekvő sorrendben vannak a táblában. 


Egyenletes eloszlás: Itt pi; — Fi minden í-re. Ekkor, ahogy azt az előbb már 
láttuk, Cw — Na. Átlagosan tehát a tábla celláinak a felét kell megnézni. 


Egy nagyon ferde eloszlás: Legyen p; — bij halS£i£N-1 éspy — JET: 
A kupacépítés elemzésénél használt háromszög alakú táblázat összegezésével be- 
látható, hogy Cw értéke nagyon kicst: CN — 2 — NET: Ez nem meglepő, hiszen 
a p; sorozat rohamosan csökken. 


Zipf eloszlás: Jelölje Hn az n-edik harmonikus számot: 
He-iáztátetó 

Ahogy azt a gyorsrendezés elemzésénél már említettük, Hn — logn-4 yt o(1), 

ahol y — 0.55721... az Euler-állandó. A Zipf eloszlás valószínűségei pi; — §. 

ahol c — irvő A Zipf eloszlás előfordul több, az adatkezelés szempontjából érde- 

kes összefüggésben. Közelítőleg ilyen eloszlást követ például egy átlagos (angol 

nyelvű) szövegben az i-edik leggyakoribb szó gyakorisága. Egyszerűen adódik, 


hogy 





N N EZ N 
On z din sg ig s Ne- ge 
íz1 izk 


A keresés várható költsége tehát V/ log N körül van. 
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80-20 szabály: . Arról a számítógépes gyakorlatban megfigyelt, sok esetben érvé- 
nyes jelenségről van szó, hogy az adatelérési igények 8096-a a rekordoknak körül- 
belül csak 2070-át érinti. Erre a 2096-ra ugyanez a szabály érvényes. Ebből követ- 
kezik, hogy az igények 6496-a az állománynak mindössze 49b-át érinti. 
A 80-20 szabály szerint viselkedő eloszlásra minden 1 £ m £ N esetén 
Pit Pit tt Pazm 
Pitt Pm 
E követelményeknek megközelítően eleget tevő eloszlást kapunk a p; — at vá- 
lasztással, ahol 
log0,8 1 


BESMG! 4-9. 1 1 
Flggba 7 FSZ és HN 14 zgegp tet a-t 


az 0,8. 








A sikeres keresés várható idejére megmutatható, hogy Cw sz 0, 122N. Egy ilyen 
eloszlást követő állományban az optimális sorrend mellett a keresés mintegy négy- 
szer gyorsabb, mint a rekordok (egyenletes eloszlás szerinti) véletlen sorrendje 
esetén. 


Önszervező módszerek 

Mít tehetünk abban az esetben, ha a p; keresési valószínűségeket nem ismerjük, 
vagy esetleg azok idővel változnak? Ilyenkor a sikeres keresés után érdemes vál- 
toztatni a rekordok sorrendjén. Az $-fáknál már láttunk példát arra, hogy vissza- 
csatoláson alapuló egyszerű változtatások jelentősen javíthatják egy adatszerkezet 
hatékonyságát. A jelen esetben a keresések sorozatát úgy is felfoghatjuk, hogy 
mintát veszünk a (p;) eloszlásból, vagyis nézzük az R — R; események a; ta- 
Pasztalati gyakoriságát. A g; gyakoriság nő, ha az éppen megtalált rekord R;, ezért 
ekkor R;-t előbbre visszük a táblában, feltéve, hogy í 2 1. Két alapvető ötletet 
említünk. 


(a) A keresett (és megtalált) R; elemet a tábla elejére visszük. Az eredmény: 





RTRTET-T TR] 











(b) A keresett (és megtalált) R; elemet felcseréljük a megelőzővel. 

















RO[..TRTRAT Z-T TEN 

















Ha az eloszlás időben változik, akkor az (a) megoldás ajánlatos. Ha a (pi) el- 
oszlás stabil, azaz időben nem változik, akkor a (b) heurisztika eredményesebb. A 
(b) változatról azt sejtik, hogy optimális megoldást ad az olyan esetekben, amikor 
egy ismeretlen statikus elosztással van dolgunk, és nem áll módunkban nyilvántar- 
tani a g; elérési gyakoriságokat. 


5. 
Információtömörítés 


Arra törekszem, hogy tíz mondatban mondjam el mindazt, amire 
másoknak egy egész könyv kell. FRIEDRICH NIETZSCHE 


Manapság óriási mennyiségű információt tárolunk a gépeinkben, és küldünk a 
szélrózsa minden irányába a hálózatok mentén. A tárolás és különösen a továbbí- 
tás költsége erősen fiigg a szóban forgó adatok mennyiségétől. Emiatt természetes 
az igény, hogy bizonyos esetekben adatainkat minél tömörebb, kompaktabb for- 
mában ábrázoljuk. Az adattömörítés mára valóságos tudományággá vált, Se szeri, 
se száma a különböző információfajták (pl. szöveg, kép, hang) összenyomására, 
illetve kibontására szolgáló módszereknek. Itt a legelső, legegyszerűbb eljárást, a 
ma már klasszikusnak számító Huffman-kódolást ismertetjük, majd a széles kör- 
ben használatos Lempel-Zív-Welch-módszer ötletét mutatjuk be. 
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Tegyük fel, hogy egy a bi, . . . , ban betűkből álló szöveget szeretnénk bítsorozatként 
kódolni. A b; betűk valamely abc jelei, és egy ezekből szerkesztett hosszú (több- 
nyire n-nét sokkal hosszabb) sorozat gazdaságos kódolása a célunk. Az egyes be- 
tűk kódjait (a nekik megfelelő bitsorozatokat) úgy akarjuk megválasztani, hogy a 
szöveg kódjának hossza minimális legyen. Ismert még az egyes betűk gaz, . . . , an 
gyakorisága a szövegben. Ha uniform, tehát ugyanolyan hosszú sorozatokat hasz- 
nálunk a kódolásra, akkor nem sok játékterünk marad, hiszen a gyakoriságoktól 
függetlenül (feltéve, hogy ezek mind pozitívak) flogon] a legrövidebb lehetsé- 
ges kódhosszúság egy betűre. Ha megengedünk eltérő hosszú kódszavakat, akkor 
a dekódolássai, a szövegnek a bítsorozatból való vísszanyerésével lehet probléma. 
Olyan kódot szeretnénk tehát, ahol a betűk kódszavainak hossza nem feltétlenül 
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azonos, és a kód egyértelműen visszafejthető. Egy lehetséges megoldást kínál a 
következő definíció: 


Definíció: Egy bitsorozatokból álló kód prefix kód, ha egy betű kódja sem pre- 
fixe (kezdősz lete) egy másik kódjának. Formálisan: ha x és y két különböző betű 
kódja, akkor nincs olyan z bitsorozat, melyre ez — y. 





Egy prefix-tulajdonságú kóddal leírt üzenet egyértelműen visszafejthető, Az 
üzenet elejétől addig megyünk a bitek mentén, amíg egy betű kódszavát kapjuk. A 
prefix-feltétel miatt csak ez lehetett az első betű. Innen ugyanígy folytatva sorban 
megfejthetjük a további betűket. 

Egy prefix kódhoz természetes módon bináris fát rendelhetünk. Vegyünk elő- 
ször egy elég nagy teljes bináris fát. Ennek balra menő éleit címkézzük nullával, a 
jobbra menőket pedig egyessel. Ebben a fában egy a gyökérből lefelé menő út köl- 
csönösen egyértelműen leírható egy bitsorozattal, az érintett élek címkéinek soro- 
zatával. Nézzük meg a b; betűk kódjainak megfelelő utakat. Ezek alsó végpontjait 
címkézzük meg b;-vel. A prefix-tulajdonság azt jelenti, hogy b; nem őse bj-nek, ha 
i 5 j. Ezért ha az előző utak által nem érintett csúcsokat és az ezekhez illeszkedő 
éleket eldobjuk a fából, akkor egy olyan bináris fát kapunk, melynek levelei ponto- 
san a bi, . . . , bn címkéjű csúcsok. Megfordítva: egy bináris fából, melynek levelein 
a b; címkék vannak (különböző leveleken különbözők), a kézenfekvő módon egy 
prefix kódot kapunk. 

Az előző megfeleltetést figyelembe véve a szövegtömörítési probléma prefix 
kód alkalmazása esetén így fogalmazható: azon bináris fák között, melynek levelei 
bi, .. . ,bn. keressünk olyat, amelyre a 37 a:h(b;) összeg minimális, ahol egy T 
csúcsra h(z) a gyökértől x-ig vezető úton bejárt élek száma. Valóban, h(b;) éppen 
a b; betű bitkódjának a hossza, így az összeg éppen a kódolt szöveg hosszát méri. 

Az előző értelemben optimális konstrukció a /uffinan-fa. Az algoritmus egy 
bináris fát épít, melynek a csúcsait pozitív valós számokkal címkézzük. Kezdetben 
n izolált csúcspontunk van. Ezek felelnek meg a b; betűknek, és ezek lesznek vé- 
gül a Huffman-fa levelei. A b;-nek megfelelő csúcs címkéje g;. Az általános lépés 
a következő. Tegyük fel, hogy már megépítettük az S7, . . . , 54 fákat, ezek győ- 
kérpontjai 21, k. utóbbiak címkéi az ri, . . . , "4 számok. Ekkor vesszük a két 
minimális címkéjű gyökeret (legyenek ezek z; :j). Ezek fölé egy új y gyökér- 
Pontot teszünk, melynek fiai xz; és zr;. Az y címkéje r; 4- r,. Ezzel a fák száma 
eggyel csökken. Megállunk, ha már csak egy fa marad. Összesen tehát n — 1 ilyen 
összevonó lépés szükséges. 

Példaként tekintsük a KAKUKKMADARAMNAK szó kódolását. Ebben hét 
betű szerepel, a legrövidebb lehetséges uniform kódhossz betűnként 3 bit. A 16 
betűs szó kódolása így 48 bitet igényel. Nézzük, mit ad a Huffman-kód. A betűk 
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gyakoriságai (a g; értékek): A: 5, K:5, M: 2, U: I, D: I, R: 1, N: I. Egy lehetséges 
kezdés, hogy először az N, és R csúcsokat (fákat) vonjuk össze, majd a D és U 
csúcsokat, utána az utóbbi fa gyökerét az M csúccsal. Az ábra egy ilyen fát mutat, 



































A betűk kódjai: K: 11, A: 10, M: 011, U: 0101, D: 0100, N: 000, R: 001. A 
szó kódjának a hossza így 40 bit, ami megtakarítást mutat az uniform kódoláshoz 
képest. 

A módszer egyszerűsége mellett figyelemre méltó, hogy a prefix kódok közül 
a lehető legjobb tömörítést eredményezi. Nevezetesen igaz a következő: 


Tétel: A Huffinan-fa optimális. Pontosabban fogalmazva. a Huffman-fa esetén 
az I — 3 arh(b;) összeg minimális azon bináris fák között, amelyek levelei 
Bisz égbe 








Bizonyítás: A Huffman-fa által adott I érték legyen Hígi, 92, . . . , jn). Tegyük fel 
még, hogy g1 £ 942 a két legkisebb gyakoriság. A fa konstrukciójából adódik, hogy 


H(g... da) — H(A1t 92.835... ,€n) kt di 82- 


Indoklásul megjegyezzük, hogy az első összevonó lépés után n—1 gyökérpont van. 
melyek címkéi rendre g1 92, 43, . . . , pn. Az ezek feletti fa éppen egy Huffman-fa, 
melynek I-értéke H(g1--a2, 93. : . . , tn), amiből az eredeti fa I-értéke gy -- g2 hoz- 
záadásával kapható. Jelölje Opt(gi, 92, : - - , tn) a gi gyakoriságok esetén elérhető 
optimális 7-értéket. 


Lemma: Legyen továbbra is gi 2 g2 a két legkisebb gyakoriság. Ekkor 


Opt(a1. 92, - - . , ga) — Opt(gi 4 d2, 93... 54m) -Hg1 T 42. 
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A lemma bizonyítása: Tegyünk először néhány megállapítást az optimális fákról. 
Egy ilyenben feltehető, hogy minden belső csúcsnak két fia van. Ha ugyanis az 
y csúcsnak csak egy fia volna, akkor y-t törölhetnénk az egy szem fiát téve a he- 
lyére, ezzel csökkentve / értékét. Legyen most z egy levél az optimális fánkban, 
melyre hír) a lehető legnagyobb. Az előbbi fejtegetés szerint z-nek van a fában 
egy y testvére. Feltehető ezután, hogy z és y címkéi gi és 92. hiszen a megfelelő 
cserék nem növelik I értékét. Töröljük egy pillanatra az z és y csúcsokat, és írjuk 
a keletkező új levélbe a gi -- g2 címkét. A fa I-értéke legyen J. Kapjuk azonnal, 
hogy Opt(gi, 92... 591) — 14 gi HF 92, amiből az optimalitás miatt következik, 
hogy az új fának is optimálisnak kell lennie a gi -- 92, 93, - . . , an gyakoriságokra 
vonatkozóan. Ez azért igaz, mert ha J-nél kisebb értékű megoldás is lenne, akkor 
ezzel az eredeti fán is tudnánk javítani. Mindebből arra jutunk, hogy 





Optíagi. 92... . vga) — Optígi -k g2,d3.-...dn) tg b g2, 


ami éppen a lemma állítása. D 





Ezután a tétel könnyű indukció n szerint. Az n — 2 esetben a Huffman- 
fa nyilván optimális, vagyis tetszőleges p és g gyakoriságokkal teljesül, hogy 
Opt(p, g) — H(p, a). Tegyük fel mármost, hogy legfeljebb n — 1 betű esetén ígaz 


a tétel állítása, és legyen bi, . . . , ban egy n elemű betűkészlet, melyre a gyakorisá- 
gok gi £ g2 £ ... . dm. Az indukciós feltevés szerint Opt(gi -- g2, 43, . . - , dn) — 
H(gi4-g2, a3. : . . , pn). A H-ra vonatkozó kiemelt formula és a lemmabeli formula 


jobboldalán levő mennyiségek tehát egyenlők. Ebből következik, hogy a balolda- 
lak is megegyeznek: 


Optía1, 92. 93. - - . . dm) — H(gi, 92. 93. . - - da )- 
Ím) 


A módszer hátránya, hogy alkalmazásához kétszer kell végigolvasni a kódo- 
landó szöveget. Az első olvasatban meghatározzuk a g], §2, . . . , gn gyakoriságo- 
kat, ezek alapján felépítjük a Huffman-fát, és a második menetben sorra elkódoljuk 
a szöveg betűjt. Úgy is fogalmazhatunk, hogy a kódolás csak akkor kezdődhet, ha 
már az egész szöveg a rendelkezésünkre áll. Ez egy sor alkalmazásnál eléggé ké- 
nyelmetlen. Vannak a Huffman-módszernek dinamikus változatai. Ezek a szöveg 
eddig olvasott részéből számolnak gyakoriságokat, és az így kapott fa szerint kó- 
dolják a következő betűt. Ennél a megközelítésnél a kódszavak fája betűről betűre 
változhat. Az ilyen egymenetes módszerek nem érnek el ugyan optimális össze- 
nyomást, de a tömörítő képességük még mindig elég kedvező. Ugyanakkor gyor- 
Sak, és megfelelnek az interaktív alkalmazások igényeinek. Ilyen megoldás van 
Néhány régebbi UNIX-változat (mint pl. a 4.2 BSD UNIX) compaci eljárásában. 
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5.2. . A Lempel-Ziv-Welch-módszer 


A. Huffman-algoritmusoktól gyökeresen eltérő szemléletű módszercsaládot java- 
solt A. Lempel és J. Ziv a hetvenes évek második felében. Ötleteiknek egy szép és 
egyszerű megvalósítását dolgozta ki T. Welch 1984-ben. A Lempel-Ziv-Welch- 
módszernek nevezett eljárás ma az egyik legnépszerűbb információtömörítő meg- 
oldás. A módszer a Huffman-algorítmussal szemben nem betűnként kódolja az 
üzenetet. A szöveg bizonyos szavaiból szótárat épít. Ez szavak egy haimaza, amit 
5-sel fogunk jelölni, A szótárról három dolgot tételezünk fel: 


—- az egybetűs szavak, azaz 2 elemei mind benne vannak 5-ben; 

- ha egy szó benne van a szótárban, akkor annak minden kezdődarabja is benne 
van; 

- a szótárban tárolt szavaknak fix hosszúságú kódjuk van; az r € § szó kódját 
c(x) jelöli. 


A gyakorlatban a kódok hosszát 12-15 bitnek érdemes választani. Az algo- 
ritmus az összenyomni kívánt szöveget 9-beli szavak egymásutánjára bontja. A 
kódolás eredménye, az összenyomott szöveg az így kapott szavak kódjainak a 50- 
rozata, Az eredeti szöveg olvasásakor gyakorlatilag egyidőben épülybővül az § 
szótár és alakul ki a felbontás. A helymegtakarítás, a tömörítés abból adódik, hogy 
sokszor helyettesítünk hosszú szavakat a rövid kódjaikkal. Az § építését és a szö- 
veg felbontását is szinte banálisan egyszerű mohó stratégiával kezeli a módszer. 
Nyoma sincs benne teljes körű optimalizálásnak, ami a Huffman-aigoritmus jel- 
lemzője. Pusztán az éppen vizsgált kis szövegdarab ismeretében alakulnak ki az 
érdemi döntések. A megoldás mégis rendkívül hatékony akár a sebességet tekint- 
jük, akár az összenyomás mértékét. 


A szótár egyik szokásos tárolási módja a szófa adatszerkezet. Aze € S szó 
ce(r) kódja úgy ís tekinthető, mint egy hivatkozás (mutató) az x-nek az §-beli elő- 
fordulására. A szöveg összenyomása úgy történik, hogy amikor az olvasás során 
egy x € § szót találunk, aminek a következő Y betűvel való folytatása már nincs 
5-ben, akkor c(r)-et kiírjuk a kódolt szövegbe. Az rY szót felvesszük az § szó- 
tárba. A szó círY ) kódja a legkisebb még eddig az 5-ben nem szereplő kódérték 
lesz. Ezután az Y betűvel kezdődően folytatjuk a bemeneti szöveg olvasását. Az 
algorítmus kicsit pontosabb megfogalmazásához legyen z egy szó típusú változó, 
K egy betű típusú változó. A z változó értéke kezdetben az összenyomni szánt 
állomány első betűje. Az eljárás futása során mindíg teljesül, hogy z € §. Az 
általános lépés a következő: 
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(0) Olvassuk a bemenő állomány következő betűjét X -ba. 

(1) Ha az előző olvasási kísérlet sikertelen volt (vége a bemenetnek), 
akkor írjuk ki c(2)-t, és álljunk meg. 

(2) Haa zK szó is §-ben van, akkor z 6— z.K, és menjünk vissza (0)-ra. 

(3) Különben (azaz ha 2K 8 5) írjuk ki e(2)-t, tegyük a 2.K szót 5-be. 
Legyen z — K, majd menjünk vissza (0)-ra. 





A módszer 5-beli szavak egymásutánjára bontja a bemeneti szöveget, A fel- 
bontásban szereplő következő szónak mindig a leghosszabb lehetséges §-beli szót 
választja. Ez az ötlet, amit mohó elemzésnek neveznek, számos más szövegkezelő 
eljárásban is használható. 


Ahogy korábban említettük, a c(g) kódok rögzített hosszúságúak. Ha például 
ez a hosszúság 12 bit, akkor az § szótárba összesen 4096 szó kerülhet, Mi történjék 
akkor, ha a kódolás során kimerül ez a keret? Ha a bemeneti szöveg elég hosszú, 
akkor ez könnyen megtörténhet, Ebben az esetben a Lempel-Ziv-Welch-algoritmus 
felhagy a szótár további bővítésével. A (3) lépésben a zK szó 5-be illesztését elő- 
író rész többé nem hajtódik végre. A mohó elemzés a , betelt" § szótárra alapozva 
folyik tovább. 

Kövessük az algoritmus működését egy példán. Az egyszerűség kedvéért le- 
gyen D — (a,b,c). Kezdetben ezek az egybetűs szavak alkotják a szótárat. A 
Szavak kódjai pozitív egészek legyenek; c(a) — 1, c(b) — 2, e(b) — 3, és az 5-be 
kerülő új szavakhoz mindig a legkisebb még nem használt pozitív egészet rendel- 
jük kódként. Legyen a bemenő szöveg ababcbababaaaaaaa. Kezdetben z értéke a. 
A K első értéke b lesz. Mivel 2K — ab nincs 5-ben, először kiírjuk az eredmény 
első jeleként a c(a) — 1-et, az ab szót 5-be illesztjük, és hozzá a négyest rendel- 
jük kódként. A z értéke a lépés befejeztével b lesz. A következő lépésben K — a. 
Mivel 2K — ba nincs $-ben, az előzőhöz hasonlóan járunk el. Kiírjuk e(b) — 2-t, 
ba az 5-be kerül, és a kódja 5 lesz, végül pedig z — a. Az általános lépés kö- 
Vetkező végrehajtásakor kerül először (2)-re a vezérlés, mivel ekkor már ab € §. 
A következő input betű olvasása után K — c, z — ab. Mivel 2K — abc £ S, 
kiírjuk ab kódját. ami 4, az abc szót 5-be illesztjük. A szó kódja 6 lesz, és végül 
Z z c. Imnen a folytatást az olvasóra bízzuk. A mohó elemzés által kapott felbontás 
ajbdjabjeldbalbablalaalagala, a szöveg kódja pedig 1243581 10111 lesz. Az § 
végső helyzetét és a benne levő szavak kódjait tartalmazza a következő táblázat: 
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a 
b 

e 

ab 
ba 
abc 
cb 
bab 
baba ] 9 
aa 10 
aaa 11 
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aaga ][ 12 














A dekódolás, az összenyomott szöveg visszafejtése is elég egyszerű, de a kó- 
doló eljárásnál azért valamivel bonyolultabb. A dekódolás első pillantásra ördön- 
gösnek tetsző vonása, hogy elvégezhető pusztán az egybetűs szavak kódjainak, va- 
lamint a kódok képzési szabályának ismeretében. Nem kell tehát az egész 5-et és 
a kódtáblát tárolni illetve elküldeni. Nem ismertetjük itt a teljes eljárást, csak az 
ötlet érzékeltetésére szorítkozunk. A lényeges mozzanat az, hogy a kódolt szöve- 
get olvasva az egyes rész-szavak visszafejtése mellett rekonstruáljuk az § halmazt 
az elemeihez tartozó kódértékekkel együtt. Lássuk, hogyan boldogulunk az előbb 
kapott12435811011 1 sorozattal! Az első két jel betű kódja, ezeket hivatalból 
ismerjük. A szöveg első két betűje tehát ab. Ez a szó nem volt a kezdeti $-ben, 
de az eleje igen; innen rájövünk, hogy a kódoló algoritmus ezt c(ab) :- 4 értékkel 
§5-be tette. Ezt tudva a harmadik jel is megfejthető, így már a bemeneti szöveg első 
négy betűjét ismerjük: abab, Ebből a szövegdarabkából a kódoló algoritmus , fejé- 
vel gondolkodva" kiderül, hogy ba volt a következő szó, ami 5-be került, és ezáltal 
c(ba) — 5. Ebben a stílusban haladunk tovább. Legtöbbször a már megismert kó- 
dok közül kerül ki a következő visszafejtendő szám. Ennek megfejtése után pedig 
a bemeneti szöveg egy hosszabb szeletét ismerjük meg, amivel pedig az 9 szótárat 
építhetjük tovább. 

Egyetlen eset van, amikor látszólag elakadunk, amikor a megfejtendő kód nem 
lesz az eddig kibontott szövegrész kódolása során kapott kódok között. Az össze- 
nyomást végző algoritmus ismeretében ekkor is tovább tudunk lépni. A helyzetet 
egy példával illusztráljuk. Tegyük fel, hogy az előbbi 12435811011 1 soroza- 
tot szeretnénk kibontani, és az ötöst már feldolgoztuk. Az eddigi kibontott szöveg 
ababcba, amin a kódoló munkáját utánozva felépíthetjük az S szótárat egészen a 
hetes kódértékű cb szóig. Ekkor látszólag bajban vagyunk, hiszen nyolcas kódú 
szó még nincs §-ben. Mi lehet ez az z szó? Az összenyomó módszer működését 
ismerve megállapíthatjuk, hogy az r szó bax alakú, ahol x egy betű. Indoklásul 
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emlékeztetünk arra, hogy a kódoló algoritmus a mohó elemzés során utoljára le- 
választott §-beli szót (ami esetünkben az ötös kódú ba) egészíti ki egy betűvel, és 
ezt teszi 5-be. 

Az x elejéből ezután kiderül az eredeti szöveg további két betűje: az ismert 
rész ababcbaba lesz, amiből látjuk, hogy a : betű csak b lehet, vagyis z — bab. A 
megfejtést tehát ekkor is folytatni tudjuk. 


A Lempel-Ziv-Welch-módszer programja rövid és viharsebes. Mind a kódo- 
lás, mind pedig a dekódolás során csak egyszer kell olvasnunk a bemeneti jel- 
sorozatot. A módszer gyorsabb a legjobb dinamikus Huffman-változatoknál, és 
erőteljesebb tömörítést is ér el azoknál a tipikus alkalmazások során (program- 
szövegek, természetes nyelvű szövegek, grafika feldolgozása). A tömörítő képes- 
ség elemzése komoly statisztikai-információelméleti eszközöket igényel, így at- 
tól itt eltekintünk. Empirikus adatként megemlítjük, hogy a szokásos alkalmazá- 
soknál 50 — 6099-ra teszik a módszerrel elérhető hosszmegtakarítást. A Lempel- 
Ziv-Welch-algoritmust használja több ismert és népszerű tömörítő program, így 
például az újabb keletű UNIX változatok compress függvénye. Hasonló ötleteken 
alapulnak a széles körben használatos zip és gzip eljárások is. 


6. 


Gráfalgoritmusok 


Kezdetben van a viszony. 

Tekintsük a primitív népek nyelvét... E nyelv sejtmagjai — e nyelv- 
taniság előtti ősformák, melyek szétrobbanásából jön lérre a szó- 
fajok sokfélesége, ezek általában valamely viszony egészét jelö- 
lik. Ahol mi azt mondjuk: , messze, távol", ott a zulu mondat- 
szót mond, mely ennyit tesz: , Ort, ahol az ember ezt kiáltja: 
sAnyám, elvesztem!" MARTIN BUBER: Én és Te 





6.1. Bevezetés 


Algorítmikus problémák megoldása során gyakran van szükségünk dolgok kö- 
zötti bináris kapcsolatok ábrázolására, kezelésére. Erre természetes modellt kí- 
nálnak a gráfok. A gráf csúcsai az objektumoknak, az élei pedig a köztük levő 
(pár-)jkapcsolatoknak felelnek még. A probléma jellegéből adódóan használhatunk 
irányított vagy irányítatlan, súlyozott vagy súlyozatlan élű gráfokat. A gráf nép- 
szerű modellező eszköz egyszerűsége, kezelhetősége és kifejező képességének tá- 
gassága miatt, A seregnyi alkalmazási terület között előkelő helyen említhető maga 
a számítástudomány. 

Az egyik legjelentősebb adatmodellező irányzat a hálós megközelítés! , ami a 
leírni kívánt jelenségkört irányított gráfokkal ábrázolja. A modell alapfogalmai a 
gráf csúcsai, az élek pedig a köztük meglevő viszonyokat, kölcsönhatásokat, kap- 
csolatokat jelölik. Gráf az egész világ — sugallják a hálós filozófia hívei. Gráfoknak 
tekinthetők a belső memóriás adatkezelés (olykor igen szövevényes) listaszerke- 
í is, ahol az adatelemek közötti mutatók (elterjedt szakkifejezéssel: pointe- 











"A régebbi adatbi rendszerek közül ezt a modellt használja pt. az IDMS, az újabbak közül 


pedig a dbVISTA. 


6.1. BEVEZETÉS 111 


rek) jelentik az éleket. Ez a terület a gráfalgoritmusok időrendben első komoly 
alkalmazási terepe. Ebben a környezetben gyakran van szükség olyan algoriítmu- 
sokra, amelyek elérhetőséggel, összefüggőséggel kapcsolatos kérdéseket válaszol- 
nak meg, vagy hatékonyan bejárják a szerkezetet. Utóbbi feladat egy változatával, 
nevezetesen a bináris fák bejárásaival (pre-, in-, postorder) már találkoztunk. 

Hasznosságukon túl az igazán csiszolt elemi gráfalgoritmusok sajátosan ér- 
dekesek is. Ennek a titka talán abban van, hogy ítt három ismeretkör szálai fo- 
nódnak egybe: gráfokkal kapcsolatos matematikai tények (pl. a feszítőfák tulaj- 
donságai), nagy erejű adatszerkezetek (pl. a kupac vagy az itt bemutatásra kerülő 
UNIÓ-HOLVAN) és általános algoritmikus elvek (pl. a mohó módszer vagy az 
optimalitás elve), A fejezetben tárgyalt módszerek tehát a közvetlen hasznukon 
túl egyszersmind az adatszerkezetekkeli kapcsolatos ismeretek alkalmazásaként is 
szolgálnak, és előkészítő anyagot adnak a későbbi, általános algoritmuselméleti 
részekhez. 

A fejezetben a meglehetősen szerteágazó anyagból csak néhány fontos és egy- 
szerű, az alkalmazásokban gyakran felmerülő feladat és gráfalgoritmus ismerte- 
tésére szorítkozhatunk. Ezek az alapvető módszerek számos más, összetettebb al- 
goritmus részét képezik, vagy éppen vázául szolgálnak. Némelyek közülük olyan 
gondolatot rejtenek magukban, amelyek kiindulópontjai voltak/lehetnek más prob- 
lémák megoldásának. 

Itt a bevezetőben tisztázzuk azokat a fogalmakat, jelöléseket, amelyeket a 
későbbiekben használni fogunk, és bemutatjuk a gráfok legtöbbször használt 
számítógépes ábrázolási módjait. Utána a legrövidebb utak keresésének felada- 
tát tanulmányozzuk. Másik központi témánkat a hatékony bejáró algorítmusok 
(mélységi és szélességi bejárás) jelentik. Ezt követően a legismertebb fe: 
algoritmusokat tekintjük át. A fejezet végén a kombinatorikus optimalizálás irá- 
nyába mutató feladatokat veszünk szemügyre: párosítások keresésével és hálózati 
folyamokkal foglalkozunk. 








6.1.1. . Alapfogalmak, jelölések 


Egy G gráf két halmazból áll: a cstícsok vagy pontok V halmazából, mely egy 
véges, nem üres halmaz; és az élek E. halmazából, melynek elemei bizonyos V- 
beli párok. Ha ezekről a pontpárokról kikötjük, hogy rendezettek legyenek, akkor 
irányított gráfról, különben pedig irányítatlan gráfról, vagy egyszerűen csak gráf- 
ról beszélünk. Az irányított gráfokat tehát nem szimmetrikus, míg az irányítat- 
lanokat szimmetrikus kapcsolatok leírására használhatjuk. Már itt megjegyezzük, 
hogy egy irányítatlan gráf felfogható speciális irányított gráfként, ha minden élét 
két — oda és vissza mutató — irányított éllel helyettesítjük. Ezt az átírást használva 
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több irányított gráfokra megfogalmazott feladat (és azt megoldó algoritmus) értel- 
mezhető (használható) irányítatlan gráfokra is. Fordítva, az irányított gráfok is te- 
kinthetők irányítatlannak úgy, hogy elfeledkezünk az élek irányításról, Ekkor nem 
teszünk különbséget az (u, v) és a (v, u) pár (él) között. 

A H halmaz elemszámát JH] jelöli. Az egyszerűség kedvéért az n és e betűk 
általában az adott gráf csúcs-, illetve élhalmazának elemszámát jelölik. Nevezete- 
sen haa G — (V, E) gráfról beszélünk, akkor n — IVI és e — [EI 

Az objektumok közötti kapcsolat sokszor jelenti út létezését vagy kommuni- 
káció lehetőségét. Ilyenkor gyakran van szükség arra, hogy az élekhez súlyokat 
vagy költségeket tartsunk nyilván, melyek például időt, hosszúságot, pénzt és még 
sok mást ábrázolhatnak. Ezt általában egy valós értékű függvényként fogjuk fel, 
melynek értelmezési tartománya a gráf élhalmaza, és melyet c-vel, a cost angol 
szó kezdőbetűjével jelölünk. 

Egy út — akár irányított, akár irányítatlan gráfban — csúcsok olyan or, . . . , Vg 
sorozata (ez lehet egyelemű is), melyre (vs, v41) minden i-re (1 £ i £ k— 1) éle 
a gráfnak. Egy utat körnek nevezünk, ha kezdő és végpontja megegyezik. Egy út, 
illetve egy kör egyszerű, ha minden csúcs, amin áthalad, különböző, kivéve a kör 
kezdő- és végpontját. Irányított gráfoknál a (v, w) él jelölésére használni fogjuk 
av a w változatot is. Egy a v csúcsból a w-be menő irányított útra általában a 
vas w jelöléssel utalunk. 

Legyen G — (V, E) egy - akár irányított, akár irányítatlan — gráf. Értelmez- 
zük a s relációt a V. ponthalmazon a következőképpen: az r,y € V csúcsokra 
x cs y, ha z és y között megy út (irányított gráfok esetén az irányítást nem fi- 
gyelembe véve, azaz a v — w élen mehetünk w-ből v-be is). Könnyen belátható, 
hogy - egy ekvivalenciareláció. A -v ekvivalenciaosztályait hívjuk a gráf kompo- 
nenseinek. Egy gráf összefüggő, ha egyetlen komponensből áll. Egy gráfot erdőnek 
nevezünk, ha irányítatlan gráfként szemlélve nem tartalmaz kettőnél több pontból 
álló egyszerű kört (körmentesség). Ha egy erdőnek csak egyetlen komponense van. 
azaz összefüggő, akkor fa. Egy (irányított) gráf egy pontjának a foka a belőle kiin- 
duló élek száma. 


Példa: A következő ábrán egy irányított gráf és annak egy súlyozott élű vál- 
tozata látható, A gráf csúcshalmaza V - (1,2,3.4,5). az élhalmaza pedig 
E — ((1,2). (1.4), (2.5), (3.2), (4.3), (4,5),(5,3)). Tehátn — 5, ése — 7. 


A 4 csúcs foka 2. 
a 
5 fi -1 
: 
4 


2 
LL i 
4 
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A súlyozott változatnál az élekre írtuk azok költségeit. Így például a 2 5. 5 
él költsé 





ége c(2,5) — —1. Az 14325 pontsorozat egy 1 "— 5 irányított út; ez egy- 
szerű út, mert a sorozatban nincs ismétlődés. Az 5325 sorozat pedig egy egyszerű 
irányított kör a gráfban. 

A gráf összefüggő, hiszen ha az élek mentén a fordított irányban is léphetünk, 
akkor bárhonnan eljuthatunk bárhová. (Ha csak az élek irányát követve haladha- 
tunk, akkor 1-be nem jutunk el egyetlen más csúcsból sem.) 

Ha a gráfból töröljük a 2-nél nagyobb súlyú éleket, akkor a megmaradó G" gráf 
egy fa lesz. A G" csúcshalmaza V, az élei pedig (1, 4), (4.3), (3,2) és (2, 5). A 
G" gráf összefüggő és körmentes. 





6.1.2. Gráfok ábrázolásai 


A gráfok kényelmesen leírhatók számítógépes adatszerkezetekkel. Itt két széles 
körben használatos megadási módjukat ismertetjük, az adjacencia-mátrixot és az 
éllistát. 


Adjacencia-mátrix 


AG — (V, E) gráf adjacencia-mátrixa (vagy szomszédossági mátrixa) a követ- 
kező - a V elemeivel indexelt — n-szer n-es mátrix: 


sr 0 haGj)gE, 
Atij1 - ( 1 ha(ij) e E. 


Irányítatlan gráfok esetén a szomszédossági mátrix szímmetrikus lesz (azaz 
Ali, j) — A[j,í) teljesül minden í, j csúcspárra). Ha az élekhez még költségeket 
is nyilván kell tartanunk, akkor az alábbi, árnyaltabb szerkezetű szomszédossági 
mátrixot fogjuk használni: 








[1] hai—j, 
C(i,j)— d elisj) hai jés (ij) éle G-nek, 
2. különben. 


Itta x szerepe csak annyi, hogy jelzi egy él nemlétét. Bizonyos esetekben más, az 
alkalmazás természetéhez jobban illeszkedő megkülönböztető jelet érdemes hasi 
nálni. Például később, a távolságok számításakor s helyett a oo jelet használjuk, 
és aVégtelenül nagy" súlyként értelmezzük. A főátlóba nullákat írtank; ezt azért 
tettük, mert a súlyozott élű gráfokra vonatkozó feladatokban, amikkel foglalkozni 
fogunk, az u — u alakú ún. hurokélek érdektelenek. 
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Az adjacencia-mátrix természetes módon tekinthető kétdimenziós tömbnek. 
Ezzel kényelmes lehetőséget kínál gráfok számítógépes leírására. 

Az előző példa kétféle (egyszerű, illetve költségeket tartalmazó) adjacencia- 
mátrixa így fest: 


: aA ISS 1 BG SD: i 05 aal ák 
00001 4 0 x x —1 
F. 4 af ESEK : EZT: BÉG : ÉRI HEG aA 3 c LÉ EGE 1 Sáök SEBEK 
00101 $£410 5 
00100 vx F.s NN 


Az adjacencia-mátrixszal való leírás egyszerű, programozástechnikai szem- 
pontból tiszta megoldás. Hátránya viszont, hogy a mérete (n? tömbelem) teljesen 
független az élek számától. Ha G-nek viszonylag kevés éle van, akkor gyakran 
hasznosabb az éllistás megadás. 


Éllistás megadás 


Ennél az ábrázolási módnál a G — (V, E) gráf minden csúcsához egy lista tartozik. 
Az í € V csúcs listájában tároljuk az í-ből kimenő éleket, és ha kell, ezek súlyát is. 
Az i listáján egy élnek a lista egy eleme (cellája) felel meg. A lista elemeit a szo- 
kásos módon, mutatókkal láncoljuk egymás után (esetleg kétszeresen, visszafelé 
menő mutatókat is alkalmazva). Alább egy ilyen szervezés vázlata látható: 


1-ből kimenő élek cellái 












































egy tipikus cella 








A (függőlegesen rajzol) n méretű L(1 : n] tömb L[i) eleme az i csúcs éllistá- 
jának a feje. Az L[í) tehát egy mutató az i-ből induló élek listájának első cellájára. 
Az (i, j) élnek megfelelő cella tartalmazza a j sorszámot, a c(i, j) súlyt (ha van), 
egy mutatót a következő cellára, és esetleg még egyet az előzőre is. 
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Egy irányított gráf éllistás megadásában az n listán összesen e cella szerepel. 
Így az egész szerkezet elfér n 4- e cellányi helyen. Irányítatlan gráfoknál a hely- 
igény n - 2e cella, hiszen az (í, j) él az í és a j csúcs listáján is megtalálható. 





Ritka gráfok esetén, amikor e jóval kisebb, mint n2, az éllistás megadás tömö- 
rebb az előzőnél. Az éllistás ábr zolás előnye még, hogy gyorsan végignézhetjük 
az egy csúcsból kiinduló es élet, Az adjacencia-mátrixos megadás mellett ví- 
szont gyorsabban el tudjuk dönteni, hogy egy adott (i, j) pár éle-e G-nek. 








6.2. A legrövidebb utak problémája (egy forrásból) 


Legyen adott egy G — (V, E) irányított gráf ac(f), f € E élsúlyokkal, A csúcsok 
például jelölhetik egy többé-kevésbé hóval borított hegység különböző pontjait, az 
élek azt, hogy el lehet-e síelni egy sípályán az egyik pontból a másikba; az élsúlyok 
pedig azt, hogy mennyi idő kell ehhez. Felmerülhet a kérdés, hogy mekkora (itt 
időben mérve) a legrövídebb út egy adort pontból egy másik adort pontba vagy 
egy adott pontból az összes többibe vagy bármely két pont között, A meglepő az, 
hogy az első két probléma , ugyanolyan nehéz": az ismert algoritmusok, amelyek 
az elsőt megoldják, egyben a másodikat is megoldják. Tehát rögtön a második 
kérdéssel fogunk foglalkozni, a harmadik problémát pedig a következő részben 
tárgyaljuk. 





Először fogalmazzuk meg pontosan a feladatot. A G gráf egy u-t v-vel össze- 
kötő (nem feltétlenül egyszerű) u "a v irányított útjának a fossza az úton szereplő 
élek súlyainak összege. Legrövidebb u -a v úton egy olyan u sz v utat értünk, 
amelynek a hossza minimális a G-beli um v utak között. Ezek után értelmezhet- 
jük az u és v csúcsok (G-beli) d(u, v) távolságát: ez 0, ha u — w; 00, ha nincs 
Us y út; egyébként pedig a legrövidebb u A v út hossza, (Vigyázat, ítt u és v 
nem felcserélhető: ha az egyik csúcs valamilyen távol van a másiktól, akkor nem 
biztos, hogy a másik ís ugyanolyan távol van az egyiktől!) A meghatározás nem 
mindig értelmes. Ha például u és v egy olyan irányított körön vannak, amelynek az 
összsúlya negatív, akkor ezen körözve akármilyen kicsi (azaz nagy abszolút értékű 
negatív) úthosszat elérhetünk. Természetes kikötés tehát, hogy G ne tartalmazzon 
negatív összsúlyú irányított kört. 

Jelöljünk ki a G gráfban egy s € V csúcsot forrásnak. Első célunk, hogy az 
u € V pontoknak az s-től való távolságát meghatározzuk. Tegyük fel továbbá, 
hogy a c( f ) élsúlyok nemnegatívak. Ekkor nyilván nincs az előbbi értelemben vett 
negatív kör. 
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A legrövidebb utak problémája (egy forrásbólj: 


Adott egy G — ÍV, E) irányított gráf, a c : E — Rt nemnegatív értékű súlyfügg. 
vény, és egy s € V csúcs (a forrás). Határozzuk még minden v € V-re a dís, v) 
távolságot. 


6.2.1. Dijkstra módszere 


A következőkben ismertetjük E. W. Dijkstra hatékony, ugyanakkor bűbájosan egy- 
szerű algorítmusát az előbb megfogalmazott feladat megoldására. Egy a G csúcsa- 
ival indexelt D( ] tömböt használunk. A D(v] értékre úgy gondolhatunk, hogy az 
minden időpiltanatban az eljárás során addig megismert legrövidebb s az v utak 
hosszát tartalmazza. A Dívj mennyiség mindenkor felső közelítése lesz a keresett 
dís, v) távolságnak. A közelítést lépésről lépésre finomítva végül a kívánt értéke- 
ket kapjuk. Az algoritmus pontosabb megfogalmazásához először tegyük fel, hogy 
a G gráf az alábbi alakú C adjacencia-mátrixával adott: 


0 hav — av, 
CÍv,wh— S elv,w) hav / w és (v, w) éle G-nek, 
00 különben. 





Kezdetben Dív] : Cls, v] minden v € V csúcsra. Válasszuk ki ezután az s 
csűcs szomszédai közül a hozzá legközelebbit, vagyis egy olyan z € V 4 (s) csú- 
csot, melyre Dír) (- Cs, z]) minimális. Ekkor biztos, hogy az egyetlen (s, z) 
élből álló út egy legrövidebb s a x út, hiszen bármerre másfele indulnánk el s-ből, 
már az első él miatt legalább ilyen hosszú utat kapnánk (az élsúlyok nemnegatí- 
vak!). Tehát x-et betehetjük (s mellé) a KÉSZ halmazba. A KÉSZ halmaz azokat 
a csúcsokat tartalmazza, amelyeknek s-től való távolságát már tudjuk. Ezek után 
módosítsuk a többi csúcs DÍwj) értékét, ha az eddig ismertnél rövidebb úton el! le- 
het érni oda £-en keresztül, azaz ha Dlr] -e(z, w) c Dliw]. Most újra válasszunk 
ki a v € V V KÉSZ csúcsok közül egy olyat, amelyre D(v] minimális. Ezen csúcs 
DÍ]-értéke már az s-től való távolságát tartalmazza az előzőhöz hasonló okok mi- 
att (ezt később bebizonyítjuk). Majd megint a DÍ ]-értékeket módosítjuk, és íg: 
tovább, míg minden csúcs be nem kerül a KÉSZ halmazba. 

Az eljárás egy mohó algoritmus: a KÉSZ halmaz bővítésekor látszólag nem a 
teljes kép figyelembe vételével választ optimumot. Mégis ezek a helyinek, korlá- 
tozott érvényűnek tűnő döntések együtt elvezetnek a tényleges optimumokhoz. A 
módszert ezek után formálisan a következő programvázlat írja le: 
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Dijkstra algoritmusa adjacencia-mátrixszal 


(KÉSZ — (s) 
for minden v € V csúcsra do 
Df(v] :— Cífs, v] (x a dís, v) távolság első közelítése x) 
(2) fori : I fon I do begín 
Válasszunk olyan z € V § KÉSZ csúcsot, melyre Dr] minimális. 
Tegyük z-et a KÉSZ-be. 
for minden w € V § KÉSZ csúcsra do 
3 Dlw) :— minfD[w], Díz) — C(z, wj) (r dís, w) új közelítése a) 
end 


A módszer helyességének igazolásához hasznos lesz a különleges út fogalma: 
egy 87 z irányított út különleges, ha a z végpontot kivéve minden pontja a KÉSZ 
halmazban van. A különleges úttal elérhető pontok éppen a KÉSZ-ből egyetlen 
éllel elérhető pontok. 





Állítás: A (2) cikíus minden iterációs lépése után érvényesek a következők: 

(a) KÉSZ pontjaira Dtfv)] a legrövidebb s -a v utak hossza. 

(b) Ha v € KÉSZ, akkor van olyan dís, v) hosszúságú (más szóval legrövidebb) 
§ aa v út is, amelynek minden pontja a KÉSZ halmazban van. 

(c) Külső (vagyis w E V N KÉSZ) pontokra Dlw) a legrövidebb különleges s -a w 
tetak hossza. 


Bizonyítás: Teljes indukciót alkalmazunk. A kezdőértékek beállítása után, amikor 
a (2) ciklus még egyszer sem futott le, mindhárom állítás nyilvánvalóan igaz. Te- 
gyük fel, hogy igazak a j-edik iteráció után, azaz miután a (2) ciklus magja j-szer 
lefutott. Azt szeretnénk belátni, hogy igazak maradnak a j -- 1-edik iteráció után 
ís, Tegyük fel, hogy az algoritmus a j -t 1. iterációs lépésben az x csúcsot választja 
a KÉSZ-be. 

(a) Gondolkozzunk indirekte: mi van, ha D(r) nem a dís, z) távolságot jelöli, azaz 
van ennél rövidebb s a x út? Ez nem lehet különleges, elvégre a (c)-re vonatkozó 
indukciós feltevés szerint Díxj az x-be vezető legrövidebb különleges utak hosszát 
tartalmazza. Ezen út s eleje" azonban különleges, mert a KÉSZ-ből indulva egy 
azon kívüli csúcsba jut el. Legyen y az út első olyan pontja, amely már nincs 
benne a KÉSZ halmazban. Ekkor az s — y útdarab hossza is kisebb, mint Díz]. 
AZ útdarab különleges, így a hossza nem kevesebb, mint Df(y). (Itt ismét használtuk 
4 (C)-re vonatkozó indukciós feltevést.) Ezeket összevetve kiderül, hogy a j-edik 
iteráció után Díy] c Dlz], ami képtelenség. hiszen ekkor az algoritmusnak 1-t 
kellett volna választania z helyett. 
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egy legjobb különleges s T úl 
1, 
j 
f 
h 
f 
f 


1 egy rövidebb út 
(lehetetlen) 





eses ert in lég ő 


(b) Ezt is elég csupán az x csúcsra igazolni, hiszen a KÉSZ korábbi pontjaira az 
indukciós feltevés adja az állítást. Már beláttuk, hogy d(s, z) — Dír]. Az utóbbi 
érték egy különleges s —— r út hossza volt a j -- 1. iteráció előtt (itt a (c)-re 
vonatkozó indukciós feltevést használtuk); annak végeztével az út minden pontja 
KÉSZ-beli lesz. 

(c) A (b) alapján d(s, v) 4 Cfv, w) a legrövidebb olyan s —— w különleges utak 
hossza, amelyek utolsó előtti pontja v. Emiatt az állítás egyenértékű a 





Dlw— min (d(s,v) 4 Cfv,w]), 
veKÉSZ 
egyenlőséggel. Miért lesz ez igaz? A (c)-re vonatkozó indukciós feltevés alapján a 
Díw) régi (a j - 1. iteráció előtti) értéke 
Dfw] — min — íd(s,v) 4 Cfv,w]). 
veKÉSZMz) 
Ezt — a már igazolt dís, z) — Dír] egyenlőséget is figyelembe véve - a (3) sorban 
a dís, r) 4 Cír, tv) mennyiséggel vetjük össze. A D[w]-be tehát tényleg az új 
KESZ halmazra vett minimum kerül. € 
Végül amikor KÉSZ már a teljes csúcshalmaz, D(v]) — d(s, v) teljesül minden 
v € V csúcsra az állítás (a) része szerint. Ezzel igazoltuk az algoritmus helyessé- 
gét. Most vizsgáljuk meg az időigényét (n csúcs esetén). A kezdőértékek beál 
O(n) elemi lépést vesz igénybe. A (2) ciklus belsejében a minimumkeresés és 2 
8) ciklus szintén 0(n)-et. így mivel a (2) ciklus ma — 1-szer fut le, az algoritmus 
0(n?) művelet, 
Példa: Nézzük a Dijkstra-algoritmus működését a következő rajzon látható G 
gráffal mint bemenettel: a forrás az s :— 1 csúcs: 
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A D tömb helyzetét mutatjuk a (2) iteráció megkezdése előtt, majd pedig az 
első három iterációs menet után. AZ utolsó, a negyedik menetben csak a KÉSZ 
halmaz változik, D nem. Vastag betűvel szedtük a KÉSZ-beli csúcsokhoz tar- 
tozó értékeket. Ezek a megfelelő legrövidebb utak hosszai. Érdemes megfigyelni a 
D(5] alakulását. Látható, hogy mindhárom menetben csökkent, míg végül elérte a 
d(1,5) értéket. 
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Dijkstra algoritmusa éllistával 


Haa G gráf ritka, vagyis kevés éle van, akkor az időigény csökkenthető, amennyi- 
ben a gráfot éllistával tároljuk. Az előző algoritmust a következőképpen módosít- 
juk: VNKÉSZ csúcsait kupacba rendezve tartjuk a DI ]) érték szerint. A kezdeti 
kupacépítés 0(n) költséggel végezhető el. A (2) ciklus belsejében levő minimum- 
keresést egy O(logn) költségű MINTÖR művelettel oldjuk meg. A DI ] érté- 
kek Újraszámolását és a kupac-talajdonság helyreállítását tutóbbi csúcsonként egy 
O(logn) költségű FOGYASZT) csak a választott csúcs szomszédaira kell eívé- 
gezni, Minden csúcsot pontosan egyszer választunk ki, és a szomszédok számának 
Összege e. Tehát itt az összidőigény O((n 4 e) log n). Ez figyelemre méltó javítás 
a mátrixos megoldáshoz képest, ha a gráf ritka, azaz e sokkal kisebb, mint n2. 

Sűrű gráfokra még komolyabb gyorsítás érhető el alkalmas d-kupaccai. Ekkor 
az előző bekezdésben taglalt teendők költsége O(n 4 ndlogan - eloggn) lesz. 
Itt az első tag a kupacépítés, a második a minimumok, a harmadik a fogyasztások 
lépésszáma. Tegyük fel, hogy G-nek sok éte van, mondjuk n15 £ e £ m és 
legyen d — [e/n]). Ekkord 2 vVn, amiből log ,n £ 2. Ezt használva 











O(n4-ndlogyn 4 elogan) — O(n4-nd 4. e) — O(n4n-e/n 4 e) — 0(e). 


Az algoritmus ebben az esetben a bemenet hosszával arányos lépésszám alatt vé- 
Bez — más szóval: lineáris idejű. Ebből következően elmondhatjuk, hogy sűrű grá- 
fokra ez az implementáció konstans szorzótól eltekintve optimális. A módszer eme 
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változata ékesszólóan példázza az adatszerkezetek alkalmazásaiban rejlő lehetősé- 
geket. Az egyszerű kupacot (vagyis 2-kupacot) használó megoldáshoz képest azért 
nyertünk, mert sokkal több a fogyasztás, mint a minimumok törlése. Az előbbiek 
pedig olcsóbbak, ha nagy a kupac d elágazási tényezője. 





Nyilvánvaló, hogy a Dijkstra-algoritmus irányítatlan gráfokra is működik, hi- 
szen egy irányítatlan gráf felfogható olyan irányított gráfnak, melyben minden él 
mindkét irányba mutat. Megjegyzésképp annyit, hogy irányítatlan gráfok esetében 
az élsúlyokra vonatkozó kétféle kikötés ugyanazt jelenti (vagyis hogy ne legyen 
negatív összsúlyú kör, illetve hogy az élsúlyok nemnegatívak), hiszen egy negatív 
irányítatlan élből egy (kettő hosszúságú) negatív kört kapunk. 





A legrövidebb utak nyomonkövetése 





Sokszor persze nemcsak a legrövidebb utak hosszára, hanem magukra a legrö- 
videbb utakra ís kíváncsiak vagyunk. Mindkét algoritmust a futási idő nagyság- 
rendjének megtartása mellett kibővíthetjük egy Pf ] tömb karbantartásával, amely 
minden csúcshoz megadja egy az eddig ismert hozzá vezető legrövidebb úton az 
utolsó el csúcsot, Azért elég csupán az utolsó előtti csúcsot tárolni, mert ha 
egy v csúcsba vezető legrövidebb útból elhagyjuk az utolsó élet, akkor nyilván az 
utolsó előtti csúcsba vezető legrövidebb utat kapunk, aminek szintén ismerjük a 
cél előtti állomását, és így tovább. Visszafelé felgombolyíthatunk egy a v-be vivő 
legrövidebb utat. 

Tehát kezdetben P[v] :— s minden v € V-re. Ezután csak annyit kell hozzá- 
tenni az algoritmushoz, hogy a (3) ciklus belsejében, ha egy külső w csúcs Dfi) 
értékét megváltoztatjuk, akkor Pfw z. hiszen ekkor találtunk egy rövidebb 
speciális utat w-be, melynek utolsó előtti állomása r. Könnyű meggondolni, hogy 
végül tényleg igaz lesz az, hogy Plv] egy legrövidebb s — v út utolsó előtti pontja; 
másként fogalmazva: d(s, v) — d(s, Plv)) — C(Pfe], v] és Plv] A v érvényes lesz 
minden v € V. 4 (5)-re. 








Feladat: Mutassuk meg, hogy a Pfv] 5 v élek egy fát alkotnak. A fa Pfv] S v 
élének a súlya legyen CÍPl[v], v]. Ekkor a fában az s-től mért távolságok ugyan- 
azok lesznek, mint a G-beli távolságok. 


6.2.2. A Bellman—Ford-módszer 


Olyan módszert ismertetünk az egy pontból induló legrövidebb utak (hosszának) 
meghatározására, amely akkor is működik, ha bizonyos élsúlyok negatívak, Csu- 
ván annyit teszünk fel. hogy G nem tartalmaz negatív zhosszúságú irányított 
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kört. Mint látni fogjuk, a nagyobb általánosságért idővel fizetünk. Az eljárás n?- 
bel arányos számú műveletet igényel. 

Feladat: Mutassuk meg, hogy ha a súlyozott élű G irányított gráfban nincs ne- 
gatív összhosszúságú irányított kör, akkor bármely két pontja között van olyan 
legrövidebb út is, ami egyszerű (azaz nem tartalmaz ismétlődő csúcsot). Követ- 
kezésképpen van nem több, mint n — 1 élből álló legrövidebb út is, ahol na G 
csúcsainak száma. 

Tegyük fel itt is, hogy a G — (V,E) súlyozott élű irányított gráf a C 
adjacencia-mátrixával adott (ebben a diagonális elemek nullák, az i, j helyzetű 
elem a e(i, j) élsúly, ha i — j éle G-nek, a többi elem pedig 00). Az egyszerűség 
kedvéért tegyük még fel. hogy V — (1,2,...,n) és s — 1. A szakirodalomban 
többnyire R. E. Bellmannak és L. R. Fordnak tulajdonított algoritmus fokozatos 
közelítéssel határozza meg az 5-ből a többi csúcsba vivő legrövidebb utak hosszát. 

A módszer tulajdonképpen egy T(1 : n — 1,1 : n)] táblázat (kétdimenziós 
tömb) sorról sorra haladó kitöltése. Azt szeretnénk elérni, hogy végül minden í, j- 
rer(l£i£n-1.1£j ón) teljesüljön, hogy 


(9) Tfi,j] — a legrövidebb olyan 1-5 j irányított utak hossza, 
h41— melyek legfeljebb i élből állnak. 


A feladatban foglalt állítás szerint ekkor Tín — 1, j) a legrövidebb 1. j utak 
hosszát tartalmazza. A módszert úgy tekinthetjük, hogy a keresett minimális tá- 
volságokat n — 1 menetben közelítjük. Az első menet, a T(1, j) sor kitöltése ké- 
Zenfekvő, hiszen nyilván T(1, j) — CfL, j]. Tegyük fel ezután, hogy az í-edik sort 
már kitöltöttük, azaz a Tf, 1], T(i, 2], . . . , Ti, n] értékekre (x) igaz. Ekkor 


(43) T[i- 1, 3) :— minfTTi, 3], minfTTi, k) - CIk, 3) 
cz 


adja az i-4.1. sor helyes értékeit. Ugyanis egy legfeljebb i-t 1 élből állóm— 1-4 j 
út kétféle lehet: 
ki Az útnak kevesebb, mint í -H 1 éle van. Ekkor ennek a hossza szerepel Té, j)- 
en. 
(b) Az út éppen i -k 1 élből áll. Legyen ! a m út utolsó előtti pontja. Ekkor a x 
Út 1 as ? szakasza i élből áll, és a m minimalitása miatt minimális hosszúságú a 
legfeljebb i élű 1 — / utak között. A hossza tehát a T már elkészült darabjára tett 
feltevésünk miatt TI, 8. Eszerint a s hossza T(i, t) 4 CII, j). 
A fejtegetés tanulsága, hogy a x hossza szerepel a (sr) jobboldalán azon 
Mennyiségek között, amelyek minimumát vesszük; tehát egyenlő a minimummal. 
A (7) rekurzió fontos és hasznos vonása, hogy a T(i -t 1, j) értéket adó mini- 
mális utak kezdődarabját, az 1 5 ( részt (illetve annak hosszát) nem kell hatalmas 
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szénakazalban keresnünk. Tudjuk ugyanis, hogy ez az útdarab is rendelkezik egy 
optimalitási tulajdonsággal: minimális hosszú a legfeljebb i élből álló 1 ? utak 
között. Optimalizálási feladatoknál gyakran találkozunk hasonló helyzettel, ami- 
kor ís az optimumot adó megoldás — alkalmasan definiált — részeinek is rendelkez- 
niük kell valamiféle optimalíitási tulajdonsággal. Ez pedig rendszerint azért igaz, 
mert ha a részeken tudnánk javítani, akkor az javítást adna giobális értelemben is. 
A jelenségre úgy szokás hívatkozni, hogy teljesül az oprimalitás elve. 








Nézzük ezután a módszer költségét! A T táblázat egy értékének a (xr) szerinti 
számítása n — 1 összeadást és ugyanennyi összehasonlítást (minimumkeresés n 
elem közül) igényel. Mindez összesen 0(n?) elemi műveletet jelent. 

A T táblázat kítöltésével egyidőben gondoskodhatunk a minimális utak nyo- 
monkövetéséről is, A Dijkstra eljárásánál alkalmazott megoldáshoz hasonlóan ele- 
gendő feljegyezni minden j csú. egy legrövidebb 1 — j út utolsó előtti pontját. 
Ezt egy P(IL : n] tömb alkalmazásával oldhatjuk meg. A P[j] értéke legyen az 
eljárás futása során az addig ismert legrövidebb 1 j út utolsó előtti pontja (kez- 
detben P[j]) — 1 minden j-re). A részletek kimunkálását az olvasóra hagyjuk. 

Végezetül megemlítjük, hogy a módszer mintegy 3n tárcella alkalmazásával 
is megvalósítható — szemben a kb. n?-tel, amit az itt leírt változat használ, 











6.3. Floyd módszere az összes csúcspár közötti távolság 
meghatározására 


Ebben a részben először azt a problémát tárgyaljuk, hogy miként lehet egy irányí- 
tott gráfban az összes pontpár távolságát meghatározni, majd ennek a problémának 
egy speciális esetét, amikor csak arra vagyunk kíváncsiak, hogy mely pontok kö- 
zött vezet egyáltalán irányított út. Végül pedig az első algoritmus egy alkalmazását 
mutatjuk be. 

Tehát nézzük először az általános kérdést! Nemnegatív élsúlyok esetén nyil- 
vánvaló, hogy ha a Dijkstra-algorítmust minden csúcsra mint forrásra lefuttatjuk, 
akkor az összes rendezett pontpár távolságát megkapjuk. Van azonban egy ennél 
közvetlenebb módszer, amelynek előnye, hogy akkor is működik, ha van a gráf- 
ban negatív élsúly (természetesen negatív összsúlyú irányított kör nem lehet). Ez 
a módszer R. W. Floyd nevéhez fűződik. 





A probléma 

Adott egy G — (V, E) irányított gráf, és egy c : EG R súlyfüggvény úgy, hogy a 
gráfban nincs negatív összsúlyú irányított kör. Határozzuk meg az összes v, w € V 
rendezett pontpárra a dív, w) távolságot. 


6.3. FLOYD MÓDSZERE 123 


6.3.1. Floyd módszere 


Tegyük fel továbbra is, hogy V — (1,2,...,n), és hogy a G gráf a C adjacencia- 
mátrixával adott. A pontpárok távolságának kiszámítására egy szintén n x n-es 
F mátrixot fogunk használni. Kezdetben F(i,j) :— Cli,j]. Ezután egy ciklust 
hajtunk végre, amelynek k-adik lefutása után F(i, j] azon í a j utak legrövi- 
debbjeinek a hosszát tartalmazza, amelyek közbülső pontjai k-nál nem nagyobb 
sorszámúak. 

Az új Fuli, j] értékeket a következőképpen számíthatjuk ki a k — 1-edik iterá- 
ció utáni Fx-1[i, j] értékekből (itt az index csak F különböző pillanatbeli értékeire 
utal, és nem ennyi különböző mátrixra). Nyilván egy legrövidebb i —: j út, me- 
lyen a közbülső pontok sorszáma legfeljebb k, vagy tartalmazza a k csúcsot vagy 
nem. Ha igen, akkor ezen út első fele egy olyan legrövidebb i a: k út, ami mentén 
a közbülső pontok sorszáma legfeljebb k — 1, tehát hosszát Fi, k) már tartal- 
mazza; második fele meg szintén egy ilyen tulajdonságú legrövidebb k u j út, 
aminek a hossza Fx-1[£, j). Használtuk itt, hogy a legrövidebb utak között vannak 
egyszerűek is (lásd a Feladatot a Bellman-Ford-nál), és itt is segítségünkre volt az 
optimalitás elve.? 

Ha az út nem tartalmazza k-t, akkor Fri, j) — Fx-1[i, 3). Mivel Fi.[i.k) — 
Fxeali,k) és F.lk,j) — F.-1[k, j], az algoritmust végrehajthatjuk az F mátrix 
egyetlen példányával. 


FLOYD algoritmusa 


(D fori: 1tondo 
forj:— 1tondo 
Fi, j1:— C(i,jl 
2 fork: 1tondo 
foríi:— 1tondo 
forj:51tondo 
PTi, j) : min( FI, j), Ffi, k) 4 F(k, j)) 





A megelőző gondolatmenet alapján k szerinti indukcióval azonnal adódik a 
következő, a Floyd-módszer , ciklusinvariánsát" megfogalmazó állítás. 


Állítás: Fli,j) a (2)-beli iteráció k-adik menete után azon legrövidebb i "o j 
ttak hosszát tartalmazza, amelyek belső csúcsai 1, 2, . . . ,k közül valók. D 
ls Sk a eg eletet Eg sti 

3A Bellman-Ford- és a Floyd-módszer a dinamikus programozás elnevezésű általános algoritmi- 
kus megközelítés jegyeit viseli. A dinamikus programozással később külön is foglalkozunk. 
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Az állítást a k — n esetre alkalmazva következik a módszer helyessége, 
vagyis hogy végül F(i,j) — díi,j) igaz minden í, j csúcspárra. Az algoritmus 
lépésszáma n?-bel arányos, hiszen a domináló rész a három egymásba ágyazott 
for ciklus. Ez nagyságrendben ugyanannyi, mintha a Dijkstra mátrixos változatát 
minden csúcsra mint forrásra lefuttatnánk (pontosabb elemzéssel kiderül, hogy a 
Floyd-módszer mintegy 5096-kal gyorsabb). Ha a gráf éleinek száma jóval kisebb 
n?-nél, és az élsúlyok nemnegatívak, akkor érdemesebb a Dijkstra-algoritmus él- 
listás változatát használni. 


Példa: Nézzük, mihez kezd a Floyd-algoritmus a következő súlyozott élű G gráf- 
fal. Látható, hogy G-ben nincs negatív kör. 





Az F tömböt négyzetes mátrixként ábrázoljuk. F; jelentése: az F tömb i- 
edik iterációs lépés utáni állapota. Az utolsó mátrix a páronkénti legrövidebb utak 
hosszát tartalmazza. 


09 5 o 1 00 0 5 00 1 4 
09 0 co o -1 05. "0 60 80. I 

FozFj-f fc 1 0 o 3 , R-fo I 0 c 0 a 
090 l0 5 000 1 0 5 
09 09 09 09 0 09 00 096 00 0 
9 5 ol 4 0 3. 21 2 
09 0 00 o -I gr JÚ váó. évet 
Fszfo 1 0 o 0 í[, Ezfzzfo ll 0 o é 0 
d 2 eu dk -k 64-22 "4.0. 
09 09 00 09 0 090 00 09 00 0 


Az Fo — Fiés F4 — Fs egyenlőségek azért igazak, mert sem 1, sem 5 nem 
lehet egy út közbülső csúcsa, hiszen !-be nem fut él, és 5-ből nem indul ki él. 
Ugyanezekkel magyarázható a sok oo érték az első oszlopban és az utolsó sorban. 
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A legrövidebb utak nyomonkövetése 


A legrövidebb utak nyomonkövetése megint csak egy menet közben karbantar- 
tott — itt már n x n-es - P tömb segítségével történhet. Kezdetben PIi, j) :— 0. 
Az algoritmushoz annyit ket! hozzátenni, hogy ha a (2) ciklus legbelsejében egy 
F(i, j) értéket megváltoztatunk, mert találtunk egy k-n átmenő rövidebb utat, ak- 
kor Pli, j] :— k. Végül Pli, j) egy legrövidebb í - j út , középső" csúcsát fogja 
tartalmazni. Az i —— j út összeállításához tehát találnunk kell egy í-ből ebbe a 
közbülső csúcsba vezető legrövidebb utat, és egy ebből a csúcsból j-be vezető 
legrövidebb utat. De ezen utaknak is ismerjük egy-egy , középső" csúcsát, és így 
tovább. A következő program a P tömb segítségével kiír egy legrövidebb í s j 
utat. 


procedure legrövidebb út(i, j:csúcs); 
var k:csúcs; 
begin 
ksz .Piláb 
"ifk 0 then return; 
legrövidebb út(i, k); 
kiír(k); 
legrövidebb út(k, j) 
end; 


Feladat: Mutassuk meg, hogy az előző kiíró program bizonyos P mátrixok esetén 
végtelen ciklusba kerülhet, de a Floyd-algoritmus eredményeként kapott P mát- 
Tixszal nem. 


6.3.2.  Tranzitív lezárás 


A bemenet ismét egy G — (V, E) irányított gráf. Most nem a legrövidebb utakra. 
hanem csak arra vagyunk kíváncsiak, hogy mely pontok között vezet irányított 
út. Persze használhatjuk Floyd módszerét is, hiszen ha az algoritmus lefutása után 
Pi, j] értéke véges, akkor van í — j út, ha pedig végtelen, akkor nincs. Kicsit 
egyszerűbb algoritmust kapunk, ha a G gráf A adjacencia-mátrixát (amiben csak 0 
és I értékek szerepelnek) Boole-mátrixként fogjuk fel, és így a műveletek logikai 
Műveletek lesznek. Ez az algoritmus megelőzte Floydét, és S. Warshali nevéhez 
fűződik. 








Definíció (tranzitív lezárt): Legyen G — (V,E) egy irányított gráfó A az 
adjacencia-mátrixa. Legyen továbbá T a következő n X n-es mátrix: 
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T.i) — 1l hai-ből j elérhető irányított úttal; 

710 különben. 
Ekkor a T mátrixot — illerve az általa meghatározott gráfot — az A márrix -— 

illerve az általa meghatározott G gráf — (reflexív) tranzitív lezártjának hívjuk. 


A probléma 


Adott a (Boole-mátrixként értelmezett) A adjacencia-mátrixával a G — (VE) 
irányított gráf. Adjuk meg a G tranzitív lezártját. 


Warshall algoritmusa tranzitív lezárásra 


Fioyd algoritmusában csak a következő változtatásokat kell tennünk. Az (1) cik- 


lusban a kezdőértékek beállítása helyett 


, a... Í 1 hai—jvagy Ali j]-L 
Té j] 7 ( 0. különben. 


A (2) ciklusban F értékeinek változtatása helyett (ugyanazt megfogalmazva logi- 
kai műveletekkel) 


(4) TI -)— Ti j) v. (Tik) A TIR, 


A Floyd-algoritmussal kapcsolatos megállapításaink megfelelői itt ís érvénye- 
sek. Jelesül a k-adik iteráció után TÍi, j) — 1, azaz igaz, ha van olyan í e j út. 
amelynek belső pontjai k-nál nem nagyobbak; és 0, azaz hamis, ha ilyen út nem 
létezik. A (--) értékadás a (2) ciklus belsejében azt fejezi ki, hogy ilyen í s j út 
akkor létezik, ha 
1. már van olyan ia j út, amely nem megy keresztül k — 1-nél nagyobb sorszámú 
csúcson, vagy 
2. vannak olyan iss kés ka j utak, amelyek nem mennek keresztül k — 1-nél 
nagyobb sorszámú csúcson. 





Az előző részhez hasonlóan itt is fenntarthatunk egy P tömböt, amiből gyorsan 
kiolvashatunk egy im j utat, ha ilyen létezik G-ben. Az algoritmus időigénye 
nyilvánvalóan 0(n3). 


6.3.3. Egy alkalmazás: centrum keresése irányított gráfban 


A legrövidebb utak témájától elköszönőben a Fioyd-módszer egyik alkalmazását 
mutatjuk be. Elő: is tisztázzuk, hogy mit értünk egy irányított gráf centrumán. 
Ezt egy analógiával készítjük elő. 
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Egy körlap minden z pontjához hozzárendelhetjük a körlap többi pontjától 
való távolságának e(z) maximumát. Ezt nyilván úgy kaphatjuk meg, hogy meg- 
húzzuk az x-en átmenő átmérőt, Az x két szakaszra osztja az átmérőt, és az eíg) 
érték ezen szakaszok közül a nem rövidebbnek a hossza. A kör középpontja az a 
pont, melyre az e(x) érték minimális. Ezzel párhuzamban értelmezzük egy gráf 
centrumát: 

A súlyozott élű G irányított gráf v csúcsára legyen 


elv) — maxfd(wv): weV). 


A v csúcs centruma G-nek, ha elv) minimális az összes v € V között. 


Algoritmus centrum keresésére: 
(íj Etőször Fioyd módszerével kiszámítjuk a G-beli pontpárok közötti távolsá- 
gokat. Ez 0(n) műveletet jelent. 
(2) Az előző lépésben kapott F mátrix minden oszlopában meghatározzuk a 
maximális értéket (azaz kiszámítjuk az efv) értékeket). Itt n-szer keresünk ma- 
ximumot n elem közül; ennek költsége 0(n?). 
(3) Végül megkeressük az n darab e(v) érték minimumát. Ennek a műveletigénye 
0(n). 

A (3)-beli minimumot adó (bármelyik) 4 csúcs a G centruma lesz. A számítás 
legköltségesebb része az (1) lépés, így a műveletigény nagyságrendje O(n?). 


6.4. Mélységi bejárás 


Gráfokkal kapcsolatos algoritmikus feladatokban gyakran van szükségünk arra, 
hogy az élek mentén lépdelve valamilyen szisztematikus módon végigjárjuk a gráf 
csúcsait. Az erre a célra való bejáró algoritmusok központi jelentőségűek a gráfal- 
goritmusok között. Bejáró módszerek adják a gráf-struktúrákon működő összetett 
algoritmusok vezérlési szerkezetét azzal, hogy szabályozzák a sorrendet, amely 
Szerint a csúcsokhoz kötődő munkákat elvégezzük. A bejáró módszerek különösen 
alkalmasak gráfok szerkezetének feltérképezésére; segítségükkel pontról pontra 
lépkedve összegyűjthetjük a kívánt információkat. Bináris fák bejárásaival (pre-, 
1n- és postorder) már foglalkoztunk. Itt két általános, tetszőleges gráfra működő 
módszert ismerünk meg. Ezek a mélységi bejárás vagy keresés (depth-first-search, 
DES) és a szélességi bejárás vagy keresés (breadth-first-search, BFS). Mindkettő 
számtalan gráfalgoritmus alapvázául szolgál. 

Hogy szemléletes képet kapjunk a két stratégiáról, nézzük meg az öreg városka 
girbe-gurba utcáin bolyongó kopott emlékezetű lámpagyújtogató esetét. Minden 
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este szürkületkor elindul, hogy végigjárja a városka lámpáit (a gráf pontjai), de 
sosem tudja hol jár, csak arra emlékszik, hogy merről jött, és egy-egy lámpánál az 
onnan induló utcácskákba (a gráf élei) bepillantva látja, hogy arrafelé a következő 
lámpa ég-e már. Tehát ahol épp éri az alkonyat, felgyújtja az útjába kerülő első 
lámpát, majd elindul az egyik — még nyilván sötét — utcán. Felgyújtja a követke- 
Zőt ís, majd továbbmegy arra, ahonnan nem lát fényt. Ezt addig folytatja, míg egy 
olyan lámpához nem ér, ahonnan kiinduló összes utcából már fény dereng feléje, 
Ekkor visszamegy arra, amerről ide érkezett, és onnan próbál másfele, a még meg 
nem gyújtott lámpák irányába indulni. Ha már erre sincs ilyen utca, akkor még 
visszább megy. Egy idő után visszaérkezik a kiindulóhelyére, és megpróbál más- 
fele elindulni. Ha már minden írányt végigjárt, újra visszajut a kezdőpontra, ahol 
mindenfelől lámpák fénye pislákol feléje, úgyhogy nyugodtan megy aludni. Mód- 
szerének lényege, hogy addig ment egyre , mélyebben" a városkába, ameddig csak 
wolt olyan hely, ahol még ter járt. 

A másik módszer szemléltetésére képzeljük el, hogy az egyik este a kopott 
emlékezetű lámpagyújtogató elhívja az összes kopott emlékezetű barátját — akik 
meglehetősen sokan vannak -, hogy segítsenek neki a lámpagyújtogatásban. A 
szenilis barátok — miután az első lámpát közösen meggyújtották — annyifelé osz- 
lanak, ahány utca indul onnan. Meggyújtják az összes szomszédos lámpát, majd 
tovább osztódnak, és indulnak a még sötét utcák felé. Tehát így , széltében" ter- 
jeszkedve özönlik el a várost. 

Hogy lássuk a két stratégia közötti lényeges különbséget. nézzük felülről a vá- 
rost. Az első módszer szerint haladva a kiindulóponttól viszonylag távoli helyeken 
már akkor is lesz fény, amikor még a kezdőpont környékén van sötét lámpa. A 
második viszont a kezdőpont kis környezetében gyújt először teljes világosságot. 

Ez a példa rámutat arra is, hogy a szélességi bejárás hatékonyan párhuzamosít- 
ható, míg a mélységi bejárásra hasonló megoldást nem ismerünk. Természetesen 
az előbbinek is van párhuzamosságot nem használó implementációja, ahol a szom- 
szédos pontokat nem egyszerre, hanem valamilyen sorrendben látogatjuk meg. 

A szélességi bejárás megoldja a legrövidebb utak problémáját egy forrásból ab- 
ban a speciális esetben, amikor minden él súlya egy. Először feltérképezi a forrás- 
tól egységnyi távolságra levő csúcsokat, majd minden további menetben az eggyel 
távolabb levőket. 

Ebben a részben a mélységi bejárást tárgyaljuk részletesebben, néhány hozzá 
kapcsolódó fogalommal, algoritmussal és alkalmazással együtt. 








6.4.1. Irányított gráfok mélységi bejárása 


A mélységi bejárás egyfajta mohó ménetelés. Egy kezdőpontból kiindulva addig 
megyünk tovább irányított élek mentén, ameddig már nem tudunk még be nem 
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járt csúcsba jutni. Ez esetben visszamegyünk az út utolsó előtti pontjáig, és on- 
nan próbálkozunk másfele tovább lépni és előremenni. Ha ezek a lehetőségek is 
kimerültek, még eggyel visszamegyünk, és így tovább. Azt, hogy a v pontból már 
nem tudunk előre lépni, úgy fejezzük ki, hogy a v pont mélységi bejárása befejező- 
dött. Előfordulhat, hogy már a kezdőpont bejárását ís befejeztük, de a gráfnak még 
mindig van olyan csúcsa, ahol nem jártunk. Ez azt jelenti, hogy a kezdőpontunkból 
nem érhető el minden pont irányított úton. Ekkor egy új kezdőpontot választunk a 
még be nem járt csúcsok közül, és innen folytatjuk a gráf mélységi bejárását. 

Legyen G — (V, E) egy irányított gráf, ahol V — (1,.. . ,n). Jelölje L[v] a v 
csúcs éllistáját (1 £ v £ n). Vegyünk föl továbbá egy bejárva(l : n] logikai vek- 
tort, amely minden ponthoz megadja, hogy jártunk-e már ott. A G gráf mélységi 
bejárását a következő programmal valósíthatjuk meg: 


procedure bejár (x elvégzi a G irányított gráf mélységi bejárását x) 
begin 
forv:— 1tondo 
bejárva[v] :— hamis; 
forv:-1tondo 
if bejárva[v] — hamis then 
mbí(v) 





end 


procedure mb (v: csúcs) 
var 
1w: csúcs; 
begin 
hb bejárva[v] :— igaz; (r meggyűjtjuk a lámpát x) 
for minden Lfv]-beli a csúcsra do 
2) if bejárva[w] — hamis then 
mbí(1w) (r megyünk a következő még sötét lámpához r) 
end 


Minden csúcsra pontosan egyszer hívjuk meg az mb eljárást, és ott egy csúcs 
minden szomszédját pontosan egyszer vizsgáljuk meg. Ezért az algoritmus idő- 
igénye O(n -k e), vagy ami ugyanaz, O(max(n, e)). Gondoljuk meg, hogy e 4-n 
lépés pusztán a gráf beolvasásához is szükséges. Tehát ennél lényegesen gyorsabb 
bejáró eljárás nem képzelhető el. A módszer lineáris idejű, amin azt értjük, hogy 
a bemenet hosszával arányos időn belül végez. 
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A bejár eljárásban az esetleges új kezdőpont a legkisebb (sorszámú) még nem 
bejárt pont lesz. Ez a választás nem lényeges a módszer működése és időigénye 
szempontjából. A fontos csak annyi, hogy viszonylag kevés munkával! találjunk új 
kiindulópontot. 


Mélységi számok és befejezési számok 


A mélységi bejárás során sok hasznos információt gyűjthetünk a gráfról. Ennek 
egyik módja, hogy a csúcsok mellé feljegyezzük az algoritmus néhány fontosabb 
történését. Itt kétféle ilyen eseménnyel foglalkozunk. A lámpás képet használva: 
rögzítjük azt az időpontot, amikor meggyűjtjuk a lámpát, és azt is, amikor vissza- 
érünk egy lámpához, aminek már minden szomszédja világít. 

Mindezeket a mélységi és a befejezési számok segítségével valósítjuk meg. 
Felvesszük az mszám[(1 : n] és bszámíl : n] egész értékű vektorokat. Az mszám[v] 
azt fogja megadni, hogy a v csúcsot a bejárás során hányadikként látogattuk meg. 
A bszámí[vj pedig azt fogja mutatni, hogy hányadikként fejeződött be a v csúcs 
mélységi bejárása. 





Definíció (mélységi számozás): A G irányított gráf csúcsainak egy mélységi szá- 
mozása a gráf v csúcsához azt a sorszámot rendeti, mely megadja, hogy az mb eljú- 
rás (1) sorában a csúcsok közül hányadikként állítottuk bejárvafv] értékét igaz-ra. 
A v csúcs mélységi számár mszámíol jelöli. 





Definíció (befejezési számozás): A G irányított gráf csúcsainak egy befejezési 
számozása a gráf v csúcsához azt a sorszámot rendeli, mely megadja, hogy a csú- 
csok közül hányadikként ért véget az mb(v) hívás. A v csúcs befejezési számát 
bszámív) jelöli. 


A mélységi és befejezési számok meghatározásához a kódot a következőkkel 
egészítjük ki: legyenek msz és bsz egész értékű változók, melyekben a már kia- 
dott legnagyobb mélységi, illetve befejezési sorszámokat szándékozzuk tárolni. A 
bejár eljárás elején beállítjuk a kezdőértékeket. Ez az 

msz : p8 
bsz 









0; 
utasításokkal tehető meg. Ugyanezen eljárás első for ciklusában az 

mszámív) :— 0: 

bszám[v] :— 0; 
értékadásokkal kinullázzuk a két új tömböt. Írjuk továbbá az mb eljárás (1) sora 
után az 
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msz :— msz A I; 
mszámív] :— msz; 
utasításpárt, és a (2) utasítás után (vagyis az end elé) a 
bsz:— bsz-4 1; 
bszámívj] :— bsz; 
kódrészletet. A kiegészítésekkel nem növeljük meg lényegesen a futási időt, hiszen 
mindezek csúcsonként konstans mennyiségű extra munkát jelentenek. A módszer 
tépésszáma így is O(n -- e) marad. 


Példa: A következő gráf csúcsai mellett feltüntettük az egyik lehetséges mélységi 
bejárása szerinti mélységi, illetve befejezési számokat. A kiindulópont a gráf leg- 
felső csúcsa. 


26 6.2 


Feladat: Tegyük fel, hogy egy bináris fa mélységi bejárását végezzük a gyökértől 
indulva. Tegyük fel továbbá, hogy a fa élei lefelé, az apától a fiú felé irányítottak, 
és a csúcsok éllistáim mindig a bal fiú szerepel először (ha létezik egyáltalán). 
Mutassuk meg, hogy ekkor a csúcsok növekvő mélységi szám szerinti sorrendje 
éppen a preorder bejárás szerinti sorrend, Ugyanígy a csúcsok növő befejezési 
szám szerinti sorrendje megegyezik a postorder sorrenddel. 





A gráf éleinek osztályozása és a mélységi feszítő erdő 


A mélységi bejárás lehetővé teszi a gráf éleinek egy érdekes osztályozását. Hívjuk 
faéleknek azokat az éleket, melyek megvizsgálásukkor még be nem járt pontba 
Mutatnak (azok az utcák, amikbe bepillantva még sötét van, ezért arra indulunk a 
következő lámpához). 


Definíció (faéh: A G — (V, E) irányított gráf v a w éle faél (az adott mély- 
ségi bejárásra vonarkozóan), ha megvizsgálásakor a (2) sorban a (bejárvalw] — 
hamis) feltérel teljesül. 
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Jelölje T azt a gráfot, amelynek csúcshalmaza V (vagyis a kiinduló G gráf 
csúcshalmaza), élei pedig a faélek. Az algoritmus szerkezetéből nyilvánvaló, hogy 
egy csúcsba legfeljebb egy faél futhat be (egy lámpát csak egyszer gyújtunk meg), 


Feladat: Mutassuk meg, hogy ha egy H összefüggő irányított gráfnak van olyan 
csúcsa, amelybe nem vezet él, és az összes többi csúcsába pontosan egy él fut be, 
akkor H körmentes (nincs benne kettőnél hosszabb egyszerű irányítatlan kör) 


A feladat állítása szerint T egy erdő. A komponenseit olyan fák alkotják, mely- 
nek pontjait egy kezdőpont bejárása során értük el. Ennek megfelelően egy ilyen 
fa élei a kezdőponttól — amit a fa gyökerének is szokás nevezni — távolodóan irá- 
nyítottak. 





Definíció (mélységi feszítő erdő, feszítőfa): Az előbb meghatározott T gráfot a 
G gráf egy mélységi feszítő erdejének nevezzük. Ha T csak egy komponensből áll, 
akkor mélységi feszítőfáról beszélünk. 





A gráf azon élei, melyek nem faélek, még további három csoportba sorolhatók. 
Ezt előkészítendő nevezzük a G gráf y csúcsát az z csúcs T-beli leszármazottjá- 
nak, ha van x a y irányított út T-ben. (Tehát x is leszármazottja önmagának.) Az 
ax csúcs részfáját az x leszármazottai és a köztük menő faélek alkotják. 


Definíció (élek osztályozása): Tekintsük a G irányított gráf egy mélységi be- 
járását és a kapott T mélységi feszítő erdőt. (Ezen bejárás szerint) G egy x 5 y éle 





faél, ha x — y éle T-nek; 

előreél, ha z — y nem faél, y leszármazottja z-nek T-ben, és xz 4 yi 
visszaél, hata leszármazottja y-nak T-ben (a hurokél is ilyen); 
keresztél, ha x és y nem leszármazottai egymásnak. 





A következő ábrán egy gráf egy mélységi feszítőfáját, a csúcsok mélységi szá- 
mozását és éleinek típusát láthatjuk: 
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Most nézzük, miként lehet hatékonyan felismerni az egyes éltípusokat. Egy 
v csúcs minden valódi leszármazottjának a mélységi száma nagyobb mszáml[v]- 
nél, hiszen T élei mentén haladva a mélységi számok nőnek. Ezért egy előreél 
kisebb mélységi számú csúcsból nagyobb sorszámúba, egy visszaél pedig — a hu- 
rokélek kivételével -— nagyobb sorszámú csúcsból kisebb sorszámúba mutat. Az 
ábra azt sugallja, hogy a keresztélek is nagyobb sorszámúból kisebb sorszámú 
csúcsba vezetnek. Valóban így is van: megmutatjuk, hogy haz Gy E E és 
mszámlír] cmszámly], akkor az z — y csak faél vagy előreél lehet. Ez esetben 
ugyanis az mbír) hívás időpontjában y-t még nem látogattuk meg. Az x — y élet 
mindenképpen megvizsgáljuk, mielőtt ez a hívás befejeződne. Ha a vizsgálat pil- 
lanatáig y-ban még nem jártunk, ezt az élet faélnek kell választanunk. Különben y 
az x-nek leszármazottja, ami azt jelenti, hogy az r — y él előreél. 

Az eddigiek alapján — pusztán a mélységi számokat használva — a visszaéleket 
még nem tudjuk megkülönböztetni a keresztélektől. Segítségül hívjuk ezért a befe- 
jezési számokat. Ha az z — yél visszaél, vagyis z leszármazottja y-nak, akkor az 
x csúcsot nyilván y bej alatt látogatjuk meg, következésképpen az z —G yél 
vizsgálatakor az y bejárása még nem fejeződött be. Ekkor tehát még bszámíy] — 0. 
Ha viszont z — 4 él keresztél, akkor z nincs benne az y részfájában. A már iga- 
zolt mszámíy] c mszámíz] egyenlőtlenség szerint y bejárása elkezdődött az 2 
bejárása előtt. E két tényből következik, hogy y bejárása befejeződött, mielőtt x-et 
meglátogattuk. Az z — y él vizsgálatakor tehát már bszáml[y] 5 0. 

Mindezek alapján a következő táblázat foglalja össze, hogy egy irányított gráf 
mélységi bejárása során hogyan tudjuk megkülönböztetni a négyféle éltípust: 








2 yegy ] haazél vizsgálatakor 








- faél mszámíy] — 0 

- visszaél mszámíy] £ mszámíz] és bszám[y] — 0 
- előreél mszámíy] 5 mszámíz] 

-keresztél . [ mszámíy] c mszámlz] és bszám[y] 5 0. 


A visszaéleknél egyenlőséget is megengedtünk. Ez azt jelenti, hogy az esetle- 
ges z — x hurokéleket visszaéleknek tekintjük. A táblázatban foglalt feltételek 
ellenőrzése állandó mennyiségű pluszmunkát ad élenként; az algoritmus ezzel kí- 
egészítve is lineáris idejű marad: 





gi bejárása — beleértve a mélységi, d befejezési 
is - O(n 7 e) lépésben megtehető. D. 


Tétel: A G irányított gráf mé 
számozást és az élek osztály 








A következő állítás a mélységi feszítő erdő részfáinak egy hasznos jellemzé- 
sét adia. Tekintsük a G (V, E) irányított eráf egy T mélységi feszítő erdejét. 
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Legyen x € V egy tetszőleges csú. s jelölje T. a feszítő erdő r-gyökerű rész- 
fájának a csúcshalmazát. A T, elemei éppen az x leszármazottai a szóban forgó 
mélységi bejárásra vonatkozóan. Legyen továbbá 


5.7 [vev 





van olyan G-beli g o y irányított út, amelyen 
a csúcsok mélységi száma legalább mszámíz] 


Az S, halmaz tehát azokból a pontokból áll, amelyek x-ből elérhetők 
olyan u — v € E élek mentén, melyek végpontjaira mszám[u] 2zmszáml[r], és 
mszámív] 2mszám[2]. 





Állítás (részfa-lemma): Tetszóleges zt € V cs 
egyenlőség. 


cs esetén érvényes a Tg sz Sz 


Bizonyítás: T,, éppen azokból a pontokból áll, amelyek r-ből faélek mentén elér- 
hetők. Az e-gyökerű részfa csúcsait x után érjük el a mélységi bejárás során, ezért 
a részfa bármely u — v élére mszám[u] 2mszám[3], és mszámív] 2 mszáml[g]. 
Ezzel beláttuk, hogy T, C Sz. 

A fordított irányú tartalmazás igazolására tegyük fel indirekte, hogy létezik egy 
y € Sz) Ty csúcs. Legyen z -— y egy az S, meghatározásában szereplő irányított 
út, Az z-— y út helyett esetleg annak egy kezdődarabját véve feltehetjük, hogy az 
út utolsó előtti v pontja Tv-ben van. A mélységi bejárás során x-szel kezdődően a 
T; pontjait látogatjuk meg; a részfán kívüli pontokra ezért vagy x előtt, vagy Te 
csúcsai után kerül sor. Az y € Sz feltétel szerint mszám[y] 2mszáml[z]. Ezy £ Te 
miatt azt jelenti, hogy y-t valamikor a 74, pontjai után látogatjuk meg, amiből arra 
jutunk, hogy mszám[y]) 5mszám[v]. Ebből következik viszont, hogy v — y faél 
vagy előreél. Mindkét esetben y € T, adódik, ellentmondva feltevésünknek, Ezzel 
beláttuk, hogy S, C T) is igaz. DO 


Következmény: Tegyiik fel, hogy a G — (V, E) gráf z csúcsából minden pont 
elérhető irányított úton. Tegyük fel továbbá, hogy a G mélységi bejárását x-szel 
kezdjük. Ekkor a mélységi feszítő erdő egyetlen fából áll. 


Bizonyítás: Ennél a bejárásnál mszám[z] — 1, amiből a feltétel alapján Sz — V. 
A részfa-lemma szerint tehát T, — V. a 


Feladat: Igazoljuk, hogy 
T, - (ly € V] mszám[y] 2 mszámíz] és bszámly] £ bszám[z]). 
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6.4.2. Irányított körmentes gráfok (DAG-ok) 


Tennivalói közé tartozik a salétrromozás: 
a felvétele, amely marékszámra vett sóból, korianderből, borókamag- 
ból. sárga-cukorból, darált fokhagymából, babértevélből és öt-hat fej 
sshagymából készült. KRÚDY GYULA: A húsvéti sódar titkai 





v etáni napon annak a pácnak 










1 irányított gráfok egy olyan osztályával foglalkozunk, amely gyakran kerül elő 
a különféle alkalmazásokban. Másrészt arról is nevezetesek ezek a gráfok, hogy 
körükben néhány elemi algoritmikus feladat gyorsabban és egyszerűbben megold- 
ható, mint általában. 


Definíció (DAGY: Egy G irányított gráf DAG (directed acyclic graph), ha nem 
tartalmaz irányított kört. 


DAG-ok a tudomány és a tervezés számos területén felbukkannak. Gyakran 

hordoz valamiféle helyességgel, konzisztenciával kapcsolatos jelentést az, hogy a 
modellezésre használt irányított gráf DAG-e, vagy sem, Ízelítőül két példát muta- 
tunk. 
1. Teendők ütemezése. Képzeljük el, hogy egy összetett tevékenység a 71, . . . , Ta 
részteendőkre bontható. Ezek általában nem függetlenek egymástól. Gyakran van- 
nak olyan feltételeink, hogy bizonyos (i, j) párokra a T; teendőt csak a 7; teendő 
elvégzése után hajthatjuk végre. Például ha a sódarkészítést egy összetett tevé- 
kenységnek fogjuk fel, akkor — Krúdy Gyula receptje szerint — a salétromozás 
előbb kell hogy legyen, mint a pácolás. 

Az ilyen feltételrendszerek természetes módon leírhatók irányított gráffal. En- 
nek csúcsai a T; teendők. A 7;-ből a T-be akkor vezet él, ha a T;-t a T; előtt kelt 
elvégezni. A receptnél maradva: a salétromozás részteendőtől él vezet a pácolás- 
hoz; a páckészítés bizonyos részfeladatai — mondjuk a koriander és a babérlevél 
hozzáadása — között pedig nem fut él egyik irányban sem. 

Látni fogjuk később. hogy a teendőket akkor és csak akkor tudjuk a feltételeket 
kielégítő sorrendben végrehajtani, ha az itt vázolt gráf DAG. Az ilyen ütemezési 
gráfok élsúlyokkal gazdagított változatai a PERT-gráfok; ezekről még lesz szó a 
későbbiekben, 








2. Várakoz. i gráfok. Temérdek olyan számítógépes rendszer van, ami egyidőben 
több felhasználót szolgál ki. Ilyennek tekinthető például egy légitársaság helyfog- 
lalási adatbázisa. A tárolt adatokkal egyszerre több program — szokásos kifejezés- 
sel: tranzakció — dolgozik. Hogy ne legyen nagy kavarodás (mondjuk hogy több 
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utas ugyanarra a helyre kap jegyet), egy tranzakció zárolja az adatbázis azon ré- 
szeit, amelyekkel dolgozni kíván. A zár időtartama alatt más tranzakció nem fér- 
het ezekhez. Ha a T, tranzakciónak egy olyan Á adatra volna szüksége, amit a Ty 
használ, és ezért zárol, akkor 72 vár amíg A felszabadul. Vannak azonban olyan 
— pattnak nevezett — helyezetek, amikor a várakozás nem segít: amikor néhány 
tranzakció , körben vár egymásra", és ezért egyikük sem tudja folytatni a munkát, 
A tranzakciók munkáját felügyelő program a patthelyzet észlelése után kilövi az 
egyik érintett T-t, hogy a többiek tovább dolgozhassanak. 

A pattok felismerésére szolgál a várakozási gráf. Ez egy irányított gráf, aminek 
csúcsai az aktív tranzakciók. A T; tranzakcióból él fut a T2-be, ha van olyan A 
adat, amit 75 használni (pl. írni vagy olvasni) szeretne, és amit Ty éppen zár alatt 
tart. A tranzakcióink között pontosan akkor nincs patthelyzet, ha a várakozási gráf 
egy DAG. Ez közvetlenül adódik a topologikus rendezésről szóló tételből, amit 
mindjárt tárgyalni fogunk. 












A DAG-tulajdonság ellenőrzése 


Fontos tehát, hogy egy irányított gráfról el tudjuk dönteni, tartalmaz-e irányított 
kört. Ha a gráf egy mélységi bejárása során találunk visszaélet, akkor a gráf nyil- 
ván tartalmaz irányított kört, azaz nem DAG, Ugyanis az u — v visszaél v pontjá- 
ból vezet (csupa faélekből álló) út u-ba. A következő egyszerű tétel azt mondja 
ki, hogy ez visszafele is igaz, így a gráf mélységi bejárása elegendő a DAG- 
tulajdonság ellenőrzéséhez. 





Tétel: Legyen G — (V, E) egy irányított gráf. Ha G egy DAG, akkor egyetlen 
mélységi bejárása során sincs visszaél. Fordítva: ha G-nek van olyan mélységi 
bejárása, amelyre nézve nincs visszaél, akkor G egy DAG. 






Bizonyítás; Az első állítást az előbb már beláttuk. A második indoklásához tegyük 
fel, hogy G nem DAG. Meg kell mutatnunk, hogy tetszőleges mélységi bejárása 
során lesz visszaél, A G nem DAG, így tartalmaz legalább egy irányított kört. 
Vegyük ennek a körnek azt a v csúcsát, melynek a szóban forgó mélységi bejárás 
során a legkisebb a mélységi száma, és vizsgáljuk meg a kör v-be mutató élét. 
Ennek kezdőpontja legyen u. 
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Mivel mszámlív] c mszámlul. ez az él csak vissza- vagy keresztél lehet, Azonban 
v-ből u elérhető irányított úton, nevezetesen a kör élein haladva, Ezen az úton 
a pontok mélységi száma nem kisebb, mint mszámí[v]. Alkalmazható a részfa- 
lemima: u a v leszármazottja lesz a mélységi feszítő erdőben. Így az u — vél 
csak visszaél lehet. 0 





Ezek után egy irányított gráfról mélységi bejárás segítségével 0(n--e) idő alatt 
el tudjuk dönteni, hogy DAG-e, vagy sem. Ha a bejárás közben találunk visszaélet, 
akkor a gráf nem DAG, különben pedig igen. 


DAG topologikus rendezése 


Emlékezzünk vissza a teendők ütemezésének problémájára. Adva van tehát n da- 
rab teendőnk, vagyis az ezeket reprezentáló n darab csúcs. Egy u — vél azt je- 
lenti, hogy az u teendőt a v előtt kell elvégezni. Ilyenkor nyilván a teendők olyan 
sorrendjét keressük, ahol ha egy teendőt előbb ket! elvégeznünk egy másiknál, 
akkor ez a sorban előbb van. Így a teendőket ebben a sorrendben elvégezhetjük 
anélkül, hogy megsértenénk az élekben megtestesülő feltételeket. 


Definíció (topologikus rendezés): Legyen G — (V, E) (IVI — n) egy irányított 
gráf. G egy topologikus rendezése a csúcsoknak egy olyan vi, . . , , Un sorrendje, 
melyben z — y € E esetén x előbb van, mint y (azaz ha x — vi,y — vi, akkor 
íz j) 


Tétel: Egy irányított gráfnak akkor és csak akkor van topologíkus rendezése, ha 
DAG. 


Bizonyítás: —: Ha G nem DAG, akkor nem lehet topologikus rendezése, mert egy 
irányított kör csúcsainak nyilván nincs megfelelő sorrendje. 

sz: Tegyük fel, hogy G egy DAG. Előszőr megjegyezzük, hogy G-ben van 
olyan csúcs, amibe nem fut be él. Ha ugyanis minden pontba menne él, akkor 
egy tetszőleges pontból kiindulva lépkedni tudnánk visszafelé az irányított éleken 
anélkül, hogy valahol is elakadnánk. E séta során egyszer , körbeérnénk", ami el- 
lentmond a DAG-tulajdonságnak. 

Ezután a csúcsok száma szerinti teljes indukciót alkalmazunk. Ha G-nek csak 
égy pontja van, akkor az állítás nyilván igaz. Tegyük fel. hogy n — 1-pontú DAG- 
ok esetén is teljesül, és legyen G egy tetszőleges n pontú DAG. G-ből hagyjunk 
el egy olyan x csúcsot a belőle kiinduló élekkel együtt, amibe nem fut be él. A 
kapott gráf legyen G1. Nyilván G1 is DAG. Az indukciós feltevés szerint a G1-nek 
létezik 204, . . . , wn- 1 topologikus rendezése. Mármost az T, W1, . . . , Wn-1 sorrend 
nyilván a G egy topologikus rendezése, D 
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A teendők elvégezhetőségének tehát tényleg szükséges és elegendő feltétele, 
hogy a hozzájuk rendelt gráf DAG legyen. Hasonló mondható a tranzakciós pél- 
dánkról: a várakozási gráf topologikus rendezhetőségéből következik, hogy vala- 
melyik T biztosan megkaphatja a hőn áhított zárat. 

A tétel gondolatmenetében egy DAG-ok topologikus rendezésére szolgáló al- 
gorítmus lappang: válasszunk ki első pontnak egy olyan csúcsot, amibe nem fut él, 
majd a maradékból egy ilyen csúcsot másodikként; és így tovább. Az ötlet a haté- 
konyan kivitelezhető a sor adatszerkezet segítségével. A sor alapja egy elemekből 
álló kettősen láncolt lista. Két alapművelet van: sorbaív, €) a v elemet a 0 sor vé- 
gére illeszti; első(0) pedig visszaadja és egyben kítörli 0-ból annak első elemét, 
Nyilvánvaló. hogy ezek a műveletek a lista elejét, illetve végét jelölő mutatókkal 
0(1) költséggel megvalósíthatók. A sort szokás még FIFO-listának (first in, first 
out) is nevezni. 

Most egy 0 sort használó topologikus rendező algoritmus vázlata következik. 








I. A (kezdetben üres) ? sorba illesszük be a G azon csúcsait, 
amelyekbe nem megy él. 

2. Ha €) üres, akkor álljunk meg, különben legyen u :— első(0). 
és írjuk ki az u csúcsot. 

3. Töröljük a gráfból az u — v éleket. Ha egy 
itt előforduló v csúcsba már nem megy él, akkor sorbaív, 0). 

4. Menjünk vissza a 2. lépéshez. 














Feladat: Mutassuk meg, hogy az előző algoritmus kiírási sorrendje tényleg a G 
topologikus rendezése, és hogy az eljárás 0(n - e) költséggel megvalósítható. 
Ugyancsak lineáris költségű topologikus rendező eljárást kaphatunk a mély- 
zzük el a G DAG egy mélységi bejárását, és írjuk ki 
it a befejezési számaik szerint növekvő wi, . . . , wa sorrendben. Ez meg- 
tehető az O(n 4 e) költségkorlát megtartása mellett. A ww csúcsot akkor írjuk ki. 
amikor a bejárása befejeződött, vagyis az mbíw) hívás utolsó utasításaként. 












Állítás: A Wn, Wn-1,  . . , Wi sorrend a G DAG egy topologikus rendezés 


Bizonyítás: Azt kell belátnunk, hogy ha ev; — 1w; éle G-nek, akkori 5 J. 
Ez azon múlik, hogy G-ben nincs visszaél. A w; — 1wj él tehát vagy fa- vagy 
előre- vagy keresztél. Ezek mindegyikéről tudjuk (élek osztályozása, részfa-lemma 
utáni feladat), hogy wz bejárása előbb fejeződik be, mint w; bejárása, vagyis 
j — bszám[íwj] — bszámíwi] — í. A wa,...,wi sorrendben így w; megelőzi 
wj-t. a 
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Legrövidebb és leghosszabb utak 


Mint már említettük, a DAG-ok egyik előnyös tulajdonsága, hogy több fontos ve- 
lük kapcsolatos feladatra gyorsabb algorítmusok ismeretesek, mint irányított grá- 
fokra általában. Nézzük például a legrövidebb utak problémáját egy forrással, Le- 
gyen G — ÍV, E) egy éllistával adott, súlyozott élű DAG és s € V. Az élsúlyok 
tetszőleges valós számok lehetnek. G-ben nincs negatív kör, mivelhogy egyáltalán 
nem tartalmaz irányított kört. A feladatot a Bellman-Ford-módszerrel O(n5) lé- 
pésben tudjuk megoldani; nemnegatív élsúlyok esetén pedig a Dijkstra-algoritmus 
időigénye 0((n 4 e) log n), 

Topologikus rendezést használva a feladat lineáris időben, azaz O(n -- e) lé- 
pésben megoldható. Tegyük fel tehát, hogy már meghatároztuk a G csúcsainak 
egy T1. T2, . . . , tn topologikus rendezését. Feltehetjük, hogy s — xi, mert csak 
a kisebbtől a nagyobb sorszámú csúcsok felé mehet él. A dís, z;) távolságokra 
érvényes a következő összefüggés: 





hp dísz) — min (dísz) eleg zi)h, 
(z.zijeE 

ahol cíg;, zi) az xj — xi él súlya. Ezt használva í — 1, 2, . . . n-re sorban kiszá- 

mithatjuk a d(s, x) távolságokat. A lényeges mozzanat az, hogy ha (r;, xi) él, 

akkor j c i, tehát d(s, x,) számításakor a d(s, x; ) értékek már tényleg a rendelke- 

zésünkre állnak. 

Mibe kerül mindez? Az i-edik távolság számításakor b; számú összeadást vég- 
zünk el, ahol b; az z;-be befutó élek száma. A minimum meghatározására költött 
összehasonlítások száma is legfeljebb b;. Ezeket i-re összegezve: e összeadásra és 
legfeljebb e összehasonlításra van szükség. Meg kell oldanunk még egy szervezési 
problémát: adott í-re gyorsan el kell tudnunk érni az xz; csúcsba bemenő éleket. 
Erről szól a következő feladat. 


Feladat: Mutassuk meg, hogy G éllistájából O(n 4 e) lépésben megkaphatjuk 
a fordított éllistájár. Utóbbiban az z; csúcs listáján az xz;-be menő éleket leíró 
cellák vannak (szemben az eredetivel, ahol is x; listája az z;-ből kiinduló éleket 
ábrázolja). 





Összesen tehát — a topologikus rendezést és a listafordítást is beleértve — 
0(n 4 €) művelettel kiszámíthatjuk a legrövidebb utak hosszát. 


A legrövidebb utak helyett érdekelhetnek bennünket a másik végletet jelentő 
leghosszabb utak is. Egy súlyozott élű G irányított gráf u, v pontjaira legyen Hu, v) 
a leghosszabb egyszerű irányított u "a v utak hossza. Azért szorítkozunk egyszerű 
utakra, mert különben a pozitív összsúlyú irányított kört tartalmazó gráfokra a de- 
finíció értelmetlen volna. 
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Az Ku,v) mennyiségek meghatározása általában hírhedten időigényes fela. 
dat, aminek néhány rokonával (Hamilton-kör keresése, Utazó ügynök) találkozni 
fogunk a 8.7.5, részben. A nehéz feladat megszelídül, ha a bemenetet jelentő gráf 
DAG. Először is megjegyezzük, hogy ha G DAG, akkor az t(u, v) definíciójában 
egyszerű út helyett elég szimplán csak utat írni, Egy DAG-ban ugyanis minden 
irányított út egyszerű. A leghosszabb utakra ezután nyilvánvalóan érvényes a (f) 
rekurzió megfelelője — minimumok helyett maximumokkal: 





í I(s.x)- max (l(s,rj)-k eíg;, . 

(9) (osz) — , max Us, aj) - ela) 

Ha G egy DAG, akkor a (t) összefüggések alapján az ts, c) mennyiségeket lé- 
nyegében ugyanazzal a módszerrel megkaphatjuk, mint a d(s, z;) távolságokat. A 
különbség csupán annyi, hogy minimumok helyett maximumokat kell számítani. 


Tétel: Ha G egy éltistával adott súlyozott élű DAG, akkor az egy forrásból induló 
legrövidebb és leghosszabb utak meghatározásának feladatai O(n 3- e) lépésben 
megoldhatók. O 


Feladat: Adjunk 0(n -- e) lépésszámú módszert a legrövidebb és a leghosszabb 
utak nyomonkövetésére. (Használjuk a Dijkstra-módszernél alkalmazott gondola- 


tot.) 


A PERT-módszer 





A PERT (Program Evaluation and Review Technigue) elnevezésű tervezé: mód- 
szertan súlyozott élű DAG-okkal ábrázolja egy összetett feladat részei közötti vi- 
szonyokat. A DAG csúcsai a nagy feladat részei, eleminek mondható teendői. Az z 
teendőből irányított él vezet az y teendőbe, ha 2-et előbb kell elvégezni, mint y-t. 
A PERT-gráfokban külön csúcsok — legyenek ezek mondjuk K és V — jelölik a 
teljes feladat kezdetét és végét. Ha a gráf éleit értelmesen definiáljuk, akkor a csú- 
csok minden topologikus rendezésekor K az első, V pedig az utolsó csúcs lesz. AZ 
éleken nemnegatív súlyok vannak. Az r — él c(r,y) súlya mondja meg, hogy 
mennyi időnek kell eltelnie az x tevékenység megkezdésétől az y megkezdéséi 
Ilyen természetű Krúdy receptjében az a kikötés, hogy a salétromozás és a pácolás 
között egy napnak el kel! telnie. 

Hogyan határozhatjuk meg a súlyozott gráf ismeretében az z részfeladat leg- 
korábbi kezdési időpontját? A válasz egyszerű: ez a leghosszabb K — z út hossza, 
azaz HK, x) lesz. Speciális esetként a teljes feladat elvégzésének minimális idő- 
igénye (K, WV). Ezek az idők az előző szakasz algoritmusával lineáris időben, 
vagyis O(n 4 e) lépésben megkaphatók. 
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A PERT-módszertan fontos fogalmai a kritikus út, él és csúcs. Kritikus úton 
olyan K V utat értünk, amelynek a hossza H(K, V]. A kritikus élek és csúcsok 
pedig a kritikus utakon levő élek, illetve csúcsok. Az elnevezés onnan ered, hogy 
ha a kritikus utakon késve kezdődnek a tevékenységek, ez az egész munka befe- 
jezését késlelteti. A következő rajzon egy PERT-gráf szerepel. A kritikus éleket 
megvastagítottuk. 





A C részfeladat nem kritikus. A legkorábbi kezdési ideje (K,C) — 3, de az 
egész projekt befejezhető 9 időegység alatt akkor is, ha C-t a K után 7 egységgel 
indítjuk. A D csúcs viszont kritikus. Ha csak kicsivel ís több, mint 5 időegység 
elteltével indítjuk, akkor az egész munka már nem fejezhető be 9 időegység alatt. 

A kritikus csúcsokat és éleket a G PERT-gráf topologikus rendezésében vissza- 
fele, azaz V-től X felé haladva határozhatjuk meg. Első lépésként megjelöljük V-t 
mint kritikus csúcsot. Általában, tegyük fel, hogy az x; csúcsnál tartunk, és 2; meg- 
jelölt (vagyis kritikus) csúcs. Ez esetben az zj; — a élet és az zj csúcsot akkor 
kell megjelölnünk, ha (t)-ban az xs — z; élen keresztül elérjük az HK, vs) maxi- 
mumot. Máshogy mondva: ha I(K, xs) — KK, z;) 7 elm; , xi) teljesül. Az eljárás 
során minden élet egyszer veszünk szemügyre, így a költség O(n -4- e). Érvényes 
tehát a következő: 








Tétel: Egy éllistával adott PERT-gráf esetén a részfeladatok legkorábbi kezdési 
ideje, ezenfelül a kritikus élek és csúcsok lineáris időben meghatározhatók. C 


6.4.3. . Erősen összefüggő (erős) komponensek 


Irányított gráfoknál az összefüggőséget ugyanúgy definiáljuk, mint az irányítatlan 
gráfoknál: tekintet nélkül az élek irányítására. Ebben az értelemben az összefüg- 
gőségre úgy gondolhatunk. hogy a gráfunk egy darabból van. Irányított gráfokra 
van azonban egy ennél jóval szigorúbb összefüggőség-fogalom is: 


Definíció (erősen összefüggő gráf): Egy G — (W.E) irányított gráf erősen 
Összefüggő, ha bármely u, v € V ponipárra létezik u co v irányított út. 
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Ha valaki tévelygett már autóval egy idegen város egyirányú utcáinak szö- 
vevényében, akkor aligha fogja vitatni, hogy ez a követelmény erősebb, mint a 
sgyalogosokra szabott" egyszerű összefüggőség. A következő gráf összefüggő, de 
nem erősen összefüggő. Az I csúcsba nem juthatunk el irányított úton egyetlen 
más csúcsból sem. 


Egy gráf összefüggő komponenseit a gráf csúcsain értelmezett ekvivalenciare- 
láció (u — v, ha van u-ból v-be menő út) osztályaiként értelmeztük. Hasonlóan 
járhatunk el, ha az elérhetőségnél az élek irányát is figyelembe akarjuk venni. 





Definíció: Legyen G — (V, E) egy irányított gráf. Bevezetünk egy relációt V -n: 
u, v € V-re legyen u sz w, ha G-ben léteznek u os w és v sa u irányított utak. 


Természetesen v Az v, hiszen a nulla hosszúságú utat ís útnak tekintjük. Nyil- 
vánvaló az is, hogy a az reláció szimmetrikus és tranzitív is. Következésképpen 
ekvivalenciareláció, ami osztályokba sorolja a gráf pontjait, 


Definíció (erős komponensek): A az reláció ekvivatenciaosztályait a G erősen 
összefüggő (röviden: erős) komponenseinek nevezzíik. 


A definícióból azonnal látható, hogy ha C" a G-nek erős komponense, akkor a 
C a pontjait összekötő élekkel együtt egy erősen összefüggő gráf. Az előző példa 


gráfjának három erős komponense van: (1), (4) és (2,3,5). 


Áltítás: Egy irányított gráf két erős komponense között az élek csak egy irányba 
mehetnek. 


BE 
ss I 
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Bizonyítás: Ha menne él a C4 erős komponensből egy másik C2-be és a C2-ből a 
C1-be ís, akkor Ci és C2 ugyanabban az erős komponensben volna. 7 


Így ha egy irányított gráfban csak az erős komponensek viszonyára vagyunk 
kíváncsiak, akkor elég nyilvántartanunk, hogy mely komponensek között vezet él. 
és milyen irányban. 


Definíció (redukált gráf): Legyen G -— (V, E) irányított gráf. G redukált gráfja 
egy irányított gráf, melynek pontjai a G erős komponensei; a C1, Ca komponensek 
között akkor van C1 — C?2 él, ha G-ben a C1 komponens valamely pontjából vezet 
él a Ca komponensbe. 


A redukált gráf mindig DAG lesz. Ugyanis egy Ci ? 026 6 0r e 0 
irányított kör a redukált gráfban azt jelentené, hogy CH JC2U:-:UOp a G ugyan- 
azon erős komponensében van. 

Most egy gyors (lineáris idejű) módszert mutatunk egy éllistával adott G — 
(V, E) irányított gráf erős komponenseinek a feltérképezésére. Az algoritmus a 
mélységi bejáráson alapul, amit mindjárt nem is egyszer, hanem kétszer hívunk 
segítségül. 


Erősen összefüggő komponensek meghatározása 


(1 Mélységi bejárással végigmegyünk G-n, közben minden pontnak sorszámot 
adunk: a befejezési számát. 

(2) Elkészítjük a Gforg gráfot, melyet úgy kapunk G-ből, hogy minden él irányí- 
tását megfordítjuk. Pontosabban: Gforg :7 (V, E"), ahol u — v € E" akkor és 
csak akkor, ha v 5 u € E. 

(3) Bejárjuk a Gfoyg gráfot mélységi bejáráss 
kezdve (az (1)-beli befejezési számozás szerint). Új gyökérpont választásakor min- 
dig a legnagyobb sorszámú csúcsot vesszük a maradékból. 





, a legnagyobb sorszámú csúccsal 


Tétel: A (3) pontban kapott fák lesznek G erős komponensei, azaz G-ben z sz y 
Pontosan akkor igaz, ha x és y egy fában vannak. 


Bizonyítás: —5: Azt kell igazolnunk, hogy egy erős komponens pontjai egy fába 
kerülnek a (3)-beli bejárás során. Ennél valamivel több is igaz: a gráf egy erős 
komponensének a pontjai bármely mélységi bejárásnál egyazon fába kerülnek. Ezt 
jé G ford gráfra alkalmazva — aminek nyilván ugyanazok az erős komponensei, mint 
G-nek - adódik az állítás. 
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Legyen tehát K egy erős komponens, és legyen z a K legkisebb mélységi 
számú pontja. Ekkor nyilván K C S,. így a részfa-lemma miatt K benne van az 
x-ben gyökerező részfában. 

-£z: Fordítva, tegyük fel. hogy z és y egy fában vannak a (3) pont szerinti mélységi 
bejárás után. Azt kel! belátnunk, hogy ekkor 7 z y a G gráfban, azaz z és y 
egymásból irányított úton elérhetők. 

Legyen a u csúcs a gyökere annak a fának. mely a (3) pont szerinti mélységi 
bejárás után T-et és y-t is tartalmazza. Mivel x leszármazottja v-nek, ezért a G ford 
gráfban van v -— z irányított út, tehát a G gráfban van egy L irányított út r-ből 
v-be. 

Legyen c! az L-nek az a pontja, amelynek az első bejárás szerinti mélységi 
száma a legkisebb. A részfa-lemma miatt L-nek az x" cu v darabjában levő csú- 
csok az (1) bejárásnál x" leszármazottai lesznek. Az x" gyökerű részfában viszont 
az T! befejezési száma a legnagyobb, így v választása miatt r — v. Az L pont- 
jai közül tehát v-t látogattuk meg legelőször, és v-nek a befejezési száma volt a 
legnagyobb. Ezek együtt azt jelentik, hogy L pontjai a v leszármazottai az első 
bejárásnál. Így G-ben van v — 2 irányított út. 

Beláttuk, hogy a G gráfban z — v. Hasonlóan adódik, hogy y 5 v. A relá- 
ció szimmetrikus és tranzitív volta miatt z xz y, azaz rz és y a G egyazon erős 
komponensében vannak. Ca 











Az első lépés 0(n--e) időt vesz igénybe. A gráf bejárása alatt kiírjuk a csúcsait 
befejezési szám szerinti sorrendben. (Emiatt a (3) lépésnél az új gyökér választá- 
sához nem kell külön rendezni őket.) A második lépés 0(e), a harmadik pedig 
O(n -- e) ideig tart. Tehát az algoritmus összidőigénye O(n 4 e). 


Feladat: Írjuk fel a G erős komponenseit abban a sorrendben, ahogy az előző algo- 
ritmus adja őket. Mutassuk meg, hogy az így kapott sorrend a G redukált gráfjának 
egyik topologikus rendezése. 


6.4.4. Irányítatlan gráfok mélységi bejárása 


A mélységi bejárás irányítatlan gráfokkal kapcsolatos feladatok megoldásában is 
hasznos. Egy irányítatlan gráf felfogható irányítottként úgy, hogy minden (u, v) 
élét az u — vés v G u élekkel helyettesítjük. Ezzel az átalakítással a 6.4.1. 
részben elmondottak irányítatlan gráfokra is értelmezhetők. 

Az irányított gráfoknál bemutatott algoritmus tehát minden változtatás nélkül 
itt ís működik. Segítségével a csúcsok számozásai (mélységi és befejezési), az 
élek osztályozása, a mélységi feszítő erdő O(n - e) költséggel megkaphatók. A 
következő két észrevétel azt mondja, hogy irányítatlan gráfoknál a bejárással kap- 
csolatos tulajdonságok egyszerűbbek: 
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- Amikor a G irányítatlan gráfot irányítottá alakítjuk, az összefüggő kompo- 
nenseiből erősen összefüggő gráfok lesznek. Ezért ha a C komponensből való z 
csúcsot választjuk a bejárás kezdőpontjául, akkor a részfa-lemma Következménye 
szerint az x részfájának csúcshalmaza pontosan C lesz. A mélységi feszítő erdő fái 
így a G összefüggő komponenseinek felelnek meg. A mélységi bejárás tehát irá- 
nyítatlan gráfok komponenseinek feltérképezésére is alkalmas. Speciális esetként: 
ha G összefüggő, akkor 0(e) költséggel egy feszítőfát kapunk. 





— Irányított gráfok bejárásakor négyféle éllel találkoztunk: fa-, előre-, vissza- és 
keresztéllel. Irányítatlan gráfoknál ebben ís egyszerűbb a kép. A (v, w) irányítattan 
él típusa legyen av — wés w — v irányított élek közül annak a típusa, amelyiket a 
bejáráskor először vizsgáljuk meg. Az élek típusát így értelmezve egy irányítatlan 
gráf mélységi bejárásánál csak fuélek és visszaélek lehetnek. Ennek bizonyításári 
vegyünk egy tetszőleges (v, w) élet. Az általánosság csorbítása nélkül feltehetjük, 
hogy az mb() eljárást a v csúcsra hívjuk meg előbb. Az mb(v) hívás során biztosan 
megvizsgáljuk av — w élet. Ha a w-t eme vizsgálat előtt még nem látogattuk 
meg, akkor v — w és ezért (v, w) is faél lesz. Ellenkező esetben w az mb(v) 
eljárás folyamán vált látogatottá, tehát w leszármazottja lesz v-nek a fában. Ez 
esetben a w bejárása fejeződik be előbb; a w — v élet előbb látjuk, mint a fordított 
párját. Ennélfogva (v, w) visszaél lesz. 





Alkalmazás: Artikulációs pont keresése 


Definíció: Legyen G — (V, E) összefüggő irányítatlan gráf. A v E V csúcs arti- 
kulációs (más szóval elvágó) pontja G-nek, ha v és a rá illeszkedő élek elhagyásá- 
val a gráf több komponensre esik szét, vagyis elveszti összefüggőségét. 





Egy gráf artikulációs pontjait a mélységi bejárás segítségével találhatjuk meg 
Hogy megértsük a következő módszert, képzeljünk magunk elé egy összefüggő 
gráfot, melynek már felépítettük a mélységi feszítőfáját. A gráf tehát csak faéleket 
és visszaéleket tartalmaz. Az utóbbiak a fa egy ágának két csúcsát kötik össze. 
Mivel keresztélek nincsenek, a fa két különböző ágát nem köti össze él. Ebből 
rögtön következik, hogy a fa gyökere pontosan akkor artikulációs pontja a gráfnak, 
ha egynél több fia van, hiszen ekkor elhagyásával a gráf a gyökér alatti részfáknak 
megfelelő darabokra esik szét. 

Most vizsgáljuk meg, hogy mi történik, ha elhagyunk egy gyökértől különböző 
v csúcsot a gráfból. Ha csak a faéleket nézzük, akkor azt látjuk, hogy a feszítőfa 
Szétesik azon részfákra, melyeknek gyökerei a v fiai, és a maradék feszítőfadarabra 
(ilyen van, mert v nem a gyökér). A visszaélek csak úgy tarthatják egybe ezeket a 
darabokat, ha a v alatti nem üres részfák mindegyikéből megy visszaél a v feletti 
feszítőfadarabba. Ez azt jelenti, hogy v-nek bármelyik ágán is indulunk el , lefelé" 
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a feszítőfában, egy visszaélen mindig , fe!" tudunk jutni v egy valódi ősébe. Ha v- 
nek van akár egyetlen olyan fia, melynek részfájából nem vezet visszaél v , fölé", 
akkor v elhagyásával ez a részfa biztosan le fog válni a gráfról. 

A v € V csúcsról el akarjuk dönteni, hogy vajon minden részfájából vezet-e 
visszaél egy valódi ősébe. E célból kiszámítjuk a felfv] értéket. Ez megadja a v 
csúcshoz annak a , feszítőfában legmagasabban levő" w csúcsnak a mélységi szá- 
mát, amelyhez el tudunk jutni v-ből úgy, hogy , lefelé" megyünk (esetleg 0 darab) 
faélen, aztán egy visszaélen , felmegyünk" w-be, Legrosszabb esetben ez a csúcs 
maga v, különben pedig w mélységi száma kisebb lesz v mélységi számánál, hi- 
szen ekkor w valódi őse v-nek. A v csúcs tehát akkor és csak akkor lesz artikulá- 
ciós pont, ha van olyan w fia, melynek a fájából nem megy v fölé visszaél, vagyis 
melyre felíw] 2 mszámív]. Ezek után foglaljuk össze egy kicsit gondosabban a 
tennivalókat. 








Módszer az artikulációs pontok megkeresésére zefüggő gráfban): 

1. Végezzük el a gráf mélységi bejárását, és határozzuk meg a csúcsok mélységi 
számát, melyet v € V-re mszámív)] jelöl. 

2. Számítsuk ki minden v csúcsra a felfv] értéket; ez megadja annak a legkisebb 
mélységi számú w csúcsnak a mélységi számát, melybe vezet visszaél v valamely 
leszármazottjából. Hogy ezt megvalósítsuk, járjuk be az első pontban kapott feszí- 
tőfát a befejezési számok szerinti sorrendben, és ebben a sorrendben töltsük ki a 
felf ) tömböt. Így amikor a fel(v] értéket próbáljuk meghatározni, akkor v minden 
y fiára felly] már ismert. 





mszáml[v], 
felfív] — min 4 minfmszámíz], ahol v — z visszaél), 
minffelly), ahol y Ba v-nek) 


3. Artikulációs pontok megkeresése: a feszítőfát bejárva av € V csúcsokról 
ellenőrizzük, hogy elvágó pontok-e. A v-re vonatkozó teszt így hangzik: 
(a) a gyökér pontosan akkor artikulációs pont, ha legalább 2 fia van a fában. 
(b) a gyökértől különböző v csúcs akkor és csak akkor artikulációs pont, ha 
van v-nek olyan y fia, hogy felly] 2 mszámív]. 
Mindhárom lépés gyakorlatilag gráf-, illetve fabejárás, ami O(n -- e) időt vesz 
igénybe. A gráf összefüggő, tehát e 2 n — 1, amiből az algoritmus összköltsége 
0(e). 


6.5. A szélességi bejárás 


Elevenítsük föl a 6.4.-beli esetet, amikor a lámpagyújtogató elhívta a barátait lám- 
pát gyújtogatni. Az általuk követett bejáró módszert próbáljuk meg átültetni tet- 


6.5. A SZÉLESSÉGI BEJÁRÁS 147 


szőleges irányított gráfra. Olyan bejárási sorrendet akarunk, ami szerint csak ak- 
kor foglalkozunk a kezdőponttól távolabbi csúcsokkal, ha a közelieket már mind 
láttuk. Meglátogatjuk tehát az első csúcsot, majd ennek a csúcsnak az összes szom- 
szédját. Aztán ezén szomszédok összes olyan szomszédját, hol még nem jártunk, 
és így tovább. Hogyan lehet ezt értelmesen megszervezni? A legjobb ismert megol- 
dás egy sort (FIFO-listát) alkalmaz. Ebbe rakjuk be az épp meglátogatott csúcsot, 
hogy majd a megfelelő időben a szomszédaira is sort keríthessünk. 


A módszer általános lépésének lényege, hogy vesszük a sor elején levő x csú- 
csot. Ezt töröljük a sorból, meglátogatjuk azokat az y szomszédait, amelyeket ed- 
díg még nem láttunk, majd ezeket az y csúcsokat a sor végére tesszük. Az algorít- 
mus keretét adó bejár eljárás tulajdonképpen ugyanaz, mint a mélységi bejárásé. 
A bejárval[1 : n]) tömb szolgál itt is a már látott csúcsok megjelölésére. 


procedure bejár (x elvégzi a G irányított gráf szélességi bejárását x) 
begin 
forv:— 1tondo 
bejárva[v] :— hamis; 
forv:— 1tondo 
if bejárva[v) — hamis then 
szbív) 





end 


procedure szb (vw: csúcs) 
var 
A: csúcsokból álló sor; 
2, y: csúcsok; 
begin 
bejárva[v] :5z igaz: 
sorba(v, 0); 
while C) nem üres do begin 
2 :z első(02): 
for minden z — y € E élre do 
4f bejárvaly] — hamis then begin 
bejárva[y] :— igaz; 
(a) sorbaly, €) 


end 








end 
end 
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A szélességi bejárás során — a mélységi mintájára — felépíthetjük a gráf egy 
szélességi feszítő erdejét. Faélnek itt ís azokat az éleket hívjuk, melyek megvízs- 
gálásukkor még be nem járt pontba mutatnak. Tehát amikor egy már meglátogatott 
ax csúcs szomszédait vizsgáljuk, és mondjuk y-t közülük még nem láttuk, akkor 
az egyre növekvő erdőhöz hozzávesszük az x — y élet (az algoritmusban a (4) 
sor után). Csakúgy, mint a mélységi bejárásnál, a faélek itt is feszítő erdőt alkot- 
nak, aminek a fái természetes módon tekinthetők gyökeres, a gyökértől távolodóan 
irányított fáknak. E fák kapcsán most is osztályozhatjuk a gráf éleit. 

AG irányított gráf szélességi bejárása során a gráf egyik éle sem bizonyulhat 
előreélnek. Ugyanis amikor eljárásunk az z csúcsot kiveszi a sorból, hogy szom- 
szédait megvizsgálja, akkor z minden még bejáratlan y szomszédját bejárttá nyil- 
vánítja, a sor végére teszi, és az z 5 yél így faél lesz. A már bejárt y szomszédok 
pedig vagy z ősei, vagy egy másik ágon (esetleg egy másik fában) találhatók. Az 
előbbi esetben az z — y él visszaél, az utóbbiban pedig keresztéf lesz. 

A szélességi bejárás alkalmazható irányítatlan gráfokra is. A szokásos módon 
az (x,y) irányítatlan élet az z — y és az y — r irányított élpár helyettesíti. 
Az élek osztályozása a mélységi bejárásnál látottakhoz hasonlóan végezhető: az 
(íz, y) irányítatlan él típusa legyen az zt — yés y — x irányított élek közül annak 
a típusa, amelyikkel a bejáráskor először találkozunk. Ezzel a megállapodással 
élve az irányítatlan gráfok szélességi bejárása során faéleken kívül csak keresztélek 
keletkeznek. Nem szerepelhet előre- vagy visszaél. Legyen ugyanis (r, y) éle G- 
nek, és tegyük fel, hogy z őse 3-nak (valamelyik fában). Nézzük, mi a helyzet 
akkor, amikor x kikerül a €? sorból. Ekkor y-ban még nem járhattunk, hiszen z fiai 
és így az összes leszármazottai csak ezután következnek. Tehát ekkor bejárvaly] — 
hamis; emiatt az algoritmus (x, y)-t faélnek választja. 











Feladat: Legyen G irányítatlan gráf. Mutassuk meg, hogy G bármely szélességi 
feszítő erdejében a fák ponthalmazai éppen a G összefüggő komponensei. (Legyen 
v az egyik fa gyökere, w pedig tetszőleges pont a G-nek a v-t tartalmazó kompo- 
nenséből. Tekintsünk egy v-ből w-be menő utat, és mutassuk meg, hogy ennek a 
pontjai a szélességi bejárás alatt mind bekerülnek a v fájába.) 


A szélességi bejárás költsége O(n -4- e), mert minden csúcsot pontosan egyszer 
teszünk be a sorba (amikor látogatottra állítjuk), és minden irányított élet egyszer 





szélességi feszítőfája lát- 
ható. A faéleket sima, a keresztéleket szaggatott vonallal jelöltük. A csúcsok mel- 
letti szám pedig azt mondja meg, hogy hányadikként látogattuk meg őket (széles- 
ségi számozás). 
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910 NR 


Még egyszer a legrövidebb utakról 


A szélességi bejárás alkalmazásával az egy forrásból induló jlegrövidebb utak fel- 
adata (lásd 6.2.) lineáris időben megoldható, ha az élsúlyok egységnyiek. 

Legyen G — ÍV, E) egy irányított gráf, és s € V egy rögzített pontja, Az 
egyszerűség kedvéért tegyük fel, hogy s-ből minden v € V csúcs elérhető irányí- 
tott úton. Megmutatjuk, hogy a szélességi bejárás segítségével a dís, v) távolságok 
(v € V) lineáris időben meghatározhatók. Jelentse D(v] a v csúcsnak az s-től való 
távolságát az s-gyökerű szélességi fában. A DÍv] mennyiségek a bejárás során a fu- 
tási idő nagyságrendjének megváltoztatása nélkül kiszámíthatók. Legyen ugyanis 
kezdetben D(5] :— 0; az szb eljárásba pedig a (x) sor után tegyük be a kézenfekvő 
Dly] — Díz) 4 I; utasítást. A kiegészített algoritmus futási ideje nyilvánvalóan 
Ok 


Tétel: Az elő: 
következők: 

1. Legyen 3 — 31, 22, . . . , €n at csúcsoknak a szélességi bejárás szerinti sorrendje. 
Ekkor D(x1) £ Dlzo) £ . . . £ Dfzn]. 

2. Ha xz — y éle G-nek, akkor Dly] £ D(z] 7-1. 

3. Dív) — dís, v) teljesül minden v € V csúcsra. 





k szerint módosított szélességi bejárás végeztével teljesülnek a 





Bizonyítás: 1. Az algoritmusra pillantva azonnal lái hogy a csúcsok az 5 — 
T1, T2,... , tn sorrendben kerülnek bele a 2 sorba. Következésképpen ebben a 
sorrendben is kerülnek ki a sórból (FIFO-tulajdonság). Innen arra jutunk, hogy ha 
azm Z s csúcs előbb van a sorrendben, mint y. akkor apo(z) nem lehet később, 
mint apa(y), ahol az apa a szélességi feszítőfában értendő. Ezt használva egyszerű 
indukcióval kapjuk, hogy a D(z1), D(x2), . . . , DÍzal számsorozat nem csökkenő. 
Ez ugyanis közvetlenül látszik a gyökérre és fiaira. Később pedig nyilván D(z:. 
Dlapa(z)] 4 1 és Dírsa]l — Dlapatx;:41)] 4 1. Ha itt a két apa különböző, 
akkor az indukciós feltevés miatt D[apa(r)) c Diapalri41)]. amiből Dízij £ 
D(zi41). Ha pedig az apák megegyeznek, akkor DÍ) — D(z:1]. 

2. Tegyük fel, hogy z — y éle G-nek; meg kell mutatnunk, hogy ekkor 
Díy] c Dlz) 4- 1. Nézzük ezért, hogy mi történik, amikor x kikerül a 2 sor- 
ból, és éppen az (x,y) élet vizsgáljuk. Ha bejárvaíy] — hamis, akkor y apja z, 
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vagyis Dly] — Dír] 4 1. Ha pedig y-t már korábban láttuk, akkor arra következ. 
tethetünk, hogy y apja előbb van a szélességi sorrendben, mint x, amiből 1. szerint 
Dlapaly)]) £ Díz]. Az utóbbi egyenlőtlenség mindkét oldalához egyet adva kap. 
juk. hogy Dly] S Dlz] -- 1. 

3. Világos egyrészt, hogy d(s,v) c Df[v] érvényes minden v € V csúcsra, 
mivelhogy a gráfban (sőt a fában) van Dív] élből álló s —— v irányított út. Elég 
tehát a fordított DÍv] £ d(s,v) egyenlőtlenségeket igazolni. Legyen evégből 
§ — Vo, YI... Yk — V egy minimális hosszúságú G-beli irányított út s-ből v-be. 
A 2. észrevételt alkalmazzuk sorra az út éleire: DÍyi] S Dlsj-4 1 — 1. majd 
Dlye]) c Dial 4-1 c 2; így folytatva végül D[v] — Díva] £ k — dís, v). Az 
érvelés ezzel teljes. 0 


A D[v] számok 3. szerint a legrövidebb s-ből v-be menő utak hosszai. A szé- 
tességi bejá ] tehát a legrövidebb utak feladatának ez a fontos speciális esete 
(minden élsúly 1) a Dijkstra-algoritmusnál gyorsabban?, lineáris időben megold- 
ható. 

A tétel 1. és 3. állításai mondják ki, hogy az eljárás tényleg a lámpagyújtogató 
és barátai széltében terjeszkedő stratégiáját valósítja meg: a kezdőpont után először 
a tőle I távolságra levő csúcsokat látogatjuk meg, utána a 2 egységnyíre levők 
jönnek, és így tovább. 

















Feladat: Legyen G egy éllistával adott irányítatlan gráf, és $ egy csúcsa. Ad- 
junk 0f(e) költségű módszert legrövidebb (legkevesebb élből álló) s-et tartalmazó 
re. (Indítsunk szélességi bejárást 5-ből. Legyenek s], 52, . . . , S az 8 
szomszédai, Legyen f a bejárás során kapott első olyan keresztél, amely az s; 
gyökerű részfák közül két különböző között fut. Ekkor f a végpontjait összekötő 
faélekkel együtt megfelelő kört ad. Az f megtalálásában segít, ha a bejárás során a 
csúcsok mellé feljegyezzük, hogy melyik s; részfájába tartoznak. Ezt a jellemzőt 
a csúcsok az apjuktól öröklik.) 








A szélességi bejárás két további alkalmazásával később, a párosítások, majd 
pedig a hálózati folyamok kapcsán ismerkedünk meg. 





"Talán helyesebb úgy fogalmazni, hogy a szélességi bejáráson alapuló módszerünk gyorsabb, 
mint a Diíjkstra korábban megísmert éllistás implementációja. Valójában a most bemutatott alyo- 
ritmust szemlélhetjük úgy, mint Dijkstra-módszer egy változatát. A már bejárt pontok halmaza a 
KÉSZ halmaz, amit a faélek mentén bővítgetünk. A tétel 1. és 3. állításából kiolvasható, hogy tel- 
jesül a Dijkstra-módszer bővítési elve: a KÉSZ-be mindig egy az 5-hez legközelebbi VAKÉSZ-beti 
pont kerül. 
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6.6. . Minimális költségű feszítőfák 





egy fa ága vége egy hangya ha elindulna — hangyánk ha nem boldogulna 

nem nő rá a gyökerére . bármely ágról eljuthatna — lepottyanva 

se más ágra bármely ágra földön mászna 

se törzsére bármely pontba törzsön kúszha 

(körmentes) (összefüggő) (ez bizony már erdő volna) 
LEHEL JENŐ 


A következő két részben irányítatlan gráfokkal (röviden: gráfokkal) foglalkozunk. 
Ennek megfelelően G — (V, E) egy irányítatlan gráfot jelöl, amelynek nm csúcsa 
és e éle van. Ezután már csak egyszerű utakkal és körökkel lesz dolgunk. A továb- 
biakban ezért úton és körön mindig egyszerű utat és kört értünk. Ebben a részben 
a minimális költségű feszítőfák keresésének problémáját fogjuk tárgyalni. Először 
tisztázzuk az alapfogalmakat. 


Definíció (minimális költségű feszítófa): Legyen G — (VE) egy összefüggő 
gráf. A G gráf egy körmentes összefüggő F — (V, E") részgráfja a gráf egy feszí- 
tőfája. Legyen továbbá az éleken értelmezve egy c: E 0 R súlyfiiggvény. Ekkor 
a G gráf egy F feszítőfája minimális költségű, ha költsége (a benne szereplő élek 
súlyainak összege) minimális G összes feszítőfája közül. 








Egy feszítőfa tehát egy olyan fa, ami a G minden pontját tartalmazza, és az élei 
a G élei közül valók. 


A probléma 
Adott egy G — (V,E) összefüggő irányítatlan gráf, és az élein értelmezett 
e: EG R súlyfüggvény. Határozzuk meg a G egy minimális költségű feszítő- 
fáját. 

A feladat természetesen merül fel olyan helyzetekben, amikor a G egy (u, v) 
éle az u és v közötti közvetlen kapcsolat lehetőségét jelenti, az él súlya pedig a 
kapcsolat kiépítésének, esetleg működtetésének valamiféle költségét. Egy olyan 
élrendszert keresünk, ami biztosítja, hogy bárhonnan eljuthatunk bárhová; ezek 
közül pedig a lehető legkisebb költségűt szeretnénk megtalálni (Id. a következő ál- 
lítást is). Tudomásunk szerint a probléma első érdemi megoldását Otakar Borúvka 
brnói professzor közölte 1926-ban. A kérdéssel Morvaország nyugati részének a 
villamosítása kapcsán találkozott: adott helyeket összekötő minimális összhosszú- 
Ságú vezetékrendszert kellett terveznie. 

Mielőtt az algoritmusok taglalásába fognánk, összefoglalunk néhány fákkal 
kapcsolatos egyszerű tényt. 
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ÁMítás: 
1. Minden legalább kétpontú fában van olvan csúcs, amiből csak egy él megy ki 
felsőfokú csúcs). 





szítőfát. 

3. Egy n-pontú efüggő gráf akkor és csak akkor fa, han — L éle van. 

4. Egy fa bármely két pontja között pontosan egy út vezet. 

5. Legyen G egy súlyozott élű összefüggő gráf. F egy minimális költségű feszítő- 
fája. Legyen g — (u, v) a G-nek egy olyan éle, ami nem éle F-nek, és tegyük fel, 
hogy az F-beli u-ból v-be vezető úton van olyan 9" él, amelvre cíg) £ e(g"). Ekkor 
az F-ből a g hozzávételével és a 9" elhagyásával adódó F" gráf is egy minimális 
költségű feszítőfa G-ben. 

















Bizonyítás: 1. A DAG-ok topologikus rendezhetőségéről szóló tétel ötlete műkö- 
dik itt is. Lépkedjünk a fa élei mentén, ügyelve arra, hogy ne használjuk kétszer 
egymás után ugyanazt az élet. A körmentesség miatt nem érhetünk vissza koráb- 
ban már látott pontba, Így lesz olyan csúcs, amiből nem tudunk továbblépni. Ez 
egy elsőfokú csúcs. 

2. Ha a gráfban van legalább 3 pontú egyszerű kör, akkor hagyjuk el ennek 
egy (u, v) élét. A gráf ezután is összefüggő marad; u-ból v továbbra is elérhető a 
körbeli kerülő úton. Ezt ismételgetve végül körmentes összefüggő gráfot, azaz egy 
feszítőfát kapunk. 

3. Először belátjuk, hogy egy n-pontú fának n — 1 éle van. Ugyanis ha a fából 
törlünk egy elsőfokú csúcsot a hozzá csatlakozó éllel együtt, akkor egy n — 1-pontú 
fát kapunk. Ebből is törölhetünk egy ilyen lógó élet. Ezt ismételve n — 1 lépés után 
az élek elfogynak, hiszen csak egy csúcs marad. 

Fordítva: legyen F egy n-pontú, n — 1-élű efüggő gráf. Legyen F" ennek 
egy feszítőfája (lásd 2.). Az előzőleg igazolt állítás szerint F"-nek ís n — 1 éle van, 
amiből F — F". 

4. Tegyük fel, hogy az u pontból az u! pontba két út vezet. Legyen f — (v,w) 
az egyik út olyan éle, ami nincs a másik úton. Nyilvánvaló ekkor, hogy f nélkül 
is eljuthatunk v-ből w-be, vagyis a gráf az f törlése után is összefüggő marad. Ez 
pedig 3. szerint képtelenség; egy fa az egyik élének a törlése után nem maradhat 
összefüggő. 

5. Az F U (g) gráfban van olyan kör, amelynek 9? éle. A g" törlésével kapott 
F" gráf tehát összefüggő marad. A csúcsainak száma ugyanannyi, mint F-é, így 
3. szerint egy feszítőfája G-nek. Végezetül pedig nyugtázzuk, hogy F" költsége 
nem lehet nagyobb, mint az F köítsége, hiszen az előbbi az utóbbiból a nem pozitív 
c(g) — c(g") mennyiség hozzáadásával kapható meg. 2 
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A piros-kék algoritmus 


A minimális feszítőfák keresésére való algoritmusok legtöbbje egy tőről származ- 
tatható. E módszerek közös vonása, hogy valamilyen módon sorra nézik a G éleit; 
bizonyosakat bevesznek a végül kialakuló minimális feszítőfába, másokat pedig 
eldobnak. A módszerek működését érdemes úgy szemlélni, hogy színezzük a G 
éleit!. Két színt használunk: a kék élek belekerülnek a végeredményt jelentő mini- 
mális feszítőfába, a pirosak pedig nem. Az élek festegetése során ügyelni fogunk 
arra, hogy az eddig kialakult (részleges) színezés mindig takaros legyen, 


Definíció (takaros színezés); Tekintsük a súlyozott élű G gráf éleinek egy rész- 
leges színezését, melynél bármely él piros, kék vagy színtelen lehet. Ez a színezés 
takaros, ha van G-nek olyan minimális költségű feszítőfája, ami az összes kék élet 
tartalmazza, és egyetlen piros élet sem tartalmaz, 


A színezés során két szabályt használunk. Ez annyit tesz, hogy egy élet csak 
akkor festünk be, ha a szabályok egyike alkalmazható. 





KÉK SZABÁLY: Válasszunk ki egy olyan 0 4 X c V csúcshalmazt, 
amiből nem vezet ki kék él. Ezután egy legkisebb súlyú 
X-ből kimenő színezetlen élet fessünk kékre. 

PIROS SZABÁLY: Válasszunk G-ben egy olyan egyszerű kört, amiben nincs 
piros él. A kör egyik legnagyobb súlyú színtelen élét 
fessük pirosra. 





Kezdetben G-nek nincs színes éle. Ebből a helyzetből indulva a két szabályt 
tetszőleges sorrendben és helyeken alkalmazzuk, amíg csak lehetséges. Nevezzük 
ezt a nagyvonalú algoritmust piros-kék algoritmusnak. Első látásra talán meglepő, 
hogy mindenképpen célt érünk, függetlenül attól, hogy milyen sorrendben színez- 
Zük az éleket. Ezt fejezi ki a következő két állítás: 


Tétel: A piros-kék eljárás működése során mindig takaros színezésünk van, Ezen 
felül a színezéssel sosem akadunk el: végül G minden éte színes lesz. 


Bizonyítás: Először belátjuk, hogy a színezés mindig takaros. Ez kezdetben, ami- 
kor még minden él színtelen, nyilván teljesül. Tegyük fel mármost, hogy egy ta- 
karos színezésünk van. Legyen F a G egy olyan minimális költségű feszítőfája, 
amely minden kék élet tartalmaz, és egyetlen pirosat sem. Tegyük fel továbbá, 





Az algoritmusoknak ezt az interpretációját Robert E. Tarjan javasotta. 
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hogy ebben a helyzetben a gráf f élét festjük be. Két eset van aszerint, hogy me- 
lyik szabályt használjuk: 

(a) A kék szabályi használjuk. Ekkor f nyilván kék lesz. Ha f éle F-nek, akkor F 
maga mutatja, hogy a színezés takaros marad. Ha f nem éle F-nek, akkor nézzük 
azt az X C V csúcshalmazt, amire a kék szabályt alkalmaztuk. Az F-ben van 
olyan út (mert feszítőfa), ami az f két végpontját összeköti. Ezen az úton pedig 
van olyan f" él, ami kimegy X -ből, ugyanis f kilép X-ből. Az F választása miatt 
f" nem lehet piros. A kék szabály szerint kék sem lehet, továbbá ec(f") 2 eff) is 
teljesül. Legyen F" az F-ből az f" törlésével és az f hozzáadásával kapott gráf. A 
9 — f ésg — f" választással alkalmazható az állítás 5. pontja. Eszerint F" egy 
minimális feszítőfa. Az F" mutatja, hogy az f befestése utáni színezés is takaros. 
(b) A piros szabályt használjuk. Ekkor f piros lesz. Ha f nem éle F-nek. akkor 
F tanúsítja a bővebb színezés takarosságát is. Ha f € F, akkor az f törlésével az 
F két komponensre esik. Pillantsunk most arra a körre, amelyre a piros szabályt 
alkalmaztuk. Ennek van olyan f"  f éle, ami a két komponens között fut. A régi 
színezés takarossága és a piros szabály miatt az f" színtelen és e(f") £ elf). Az 
J" végpontjait összekötő F-beli út tartalmazza az f élet. Az 5. ismét alkalmazható 
(g - f.g" — fd: az F-be f helyett f/-t véve a kapott F" egy minimális költségű 
feszítőfa lesz, ami szavatolja, hogy az új színezés is takaros. 

Nézzük a második állítást: tegyük fel, hogy van még egy f színtelen él. A 
színezés takarossága miatt a kék élek egy erdőt alkotnak. Ennek az erdőnek az 
összefüggő komponenseit a továbbiakban kék fáknak fogjuk nevezni. Ha f vég- 
pontjai ugyanabban a kék fában vannak, akkor a piros szabály alkalmazható arra 
körre, aminek az élei f és az f végpontjait összekötő (egyetlen) kék út élei. Ha f 
különböző kék fákat köt össze, akkor pedig a kék szabály működik; X legyen az 
egyik olyan fa csúcshalmaza, amihez f csatlakozik. (Ez utóbbi esetben nem biztos, 
hogy f fog színt kapni a következő lépésben.) A színezés tehát folytatható. €1 


















Következmény: Ha a piros-kék algoritmussal befestjiük az összefüggő G - 
(V, E) gráf minden élét, akkor a kék élek egy minimátis költségű feszítőfa élei. Sőt. 
ez már akkor is igaz, amikor van IV] — 1 kék élünk (és esetleg van még színezerlen 


él). 





Bizonyítás: Az első állítás azonnal következik abból, hogy a végső színezés is 
takaros. A második pedig az elsőből: végül összesen IV] — 1 kék él lesz. Ha már 
van ennyi, akkor több nem keletkezhet. D 


A piros-kék algoritmus tanulsága, hogy bárhol és bármikor is alkalmazzuk 
sorra a két szabályt, végül mindenképpen egy minimális költségű feszítőfát ka- 
punk. A recept helyessége szempontjából tehát közömbös a sorrend. Mint később 
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látai fogjuk, a hatékonyság szempontjából viszont nem. A következő nevezetes 
algoritmusok a piros-kék módszer pontosított változatainak tekinthetők. 





PRIM MÓDSZERE: Legyen s a G egy rögzített csúcsa. Minden egyes szí- 
nező lépéssel az s-et tartalmazó F kék fát bővítjük. Kezdetben az F csúcs- 
halmaza (s), végül pedig az egész V. A következő kék élnek az egyik 
legkisebb súlyú élet választjuk azok közül, amelyek F-beli pontból F-en 
kívüli pontba mennek. 


KRUSKAL MÓDSZERE: A következő befestendő f él legyen mindig a 
legkisebb súlyú színtelen él. Ha az f két végpontja ugyanazon kék fában 
van, akkor az él legyen piros, különben pedig kék. 


Prim algoritmusa minden lépésben a kék szabályt használja; X-nek választható az 
F csúcshalmaza. A Kruskal-módszer a piros szabály szerint színez, amikor f-et 
pirosra festi. A szabály arra az egyszerű körre alkalmazható, aminek az élei f és a 
két végpontját összekötő kék út élei. Ha pedig f az Fi és F2 kék fákat köti össze, 
akkor X-et az F) csúcshalmazának választva teljesülnek a kék szabályban fog- 
lalt feltételek. Az előzőek szerint mindkét módszer végül egy minimális költségű 
feszítőfát ad. 

Valamivel bonyolultabb stratégiát követ a Borűvka-módszer, aminek a műkö- 
dése menetekre osztható. Egy menetben több élet választunk ki, és azok minde- 
gyikét kékre színezzük. Az egyszerűség kedvéért itt tegyük fel, hogy G-nek nincs 
két egyforma súlyú éle. 


BORÚVKA MÓDSZERE: Minden egyes kék fához válasszuk ki a legkisebb 
súlyú belőle kimenő (színtelen) élet. Színezzük kékre a kiválasztott éleket. 


Egy élet két fához is kiválaszthatunk; természetesen ekkor is csak egyszer kell 
kékre festeni. Ez a módszer is a piros-kék algoritmus specializált változta. Tegyük 
fel ugyanis, hogy az algoritmus valamelyik menetében az fi, fa, . . . , fk éleket vá- 
lasztotta ki. A számozás esetleges megváltoztatása árán feltehetjük, hogy az éleket 
súly szerint növekvően írtuk fel, azaz cífi) ca e(f2) c ":: c elf). Jelöljön 
továbbá F; egy olyan kék fát, amihez f;-t választottuk, és legyen X; az F; csúcs- 
halmaza. A Borűvka-módszer menete, amely az f; éleket kékre festi, úgy tekint- 
hető, hogy az X; (i — 1, 2, . . . , k) halmazokra sorra alkalmazzuk a kék szabályt. 
Annyit kell csak észrevenni, hogy az fi, fa, . . . , fi1 élek egyikének sincs pontja 
X;-ben, ellenkező esetben ugyanis nem az f;-t választottuk volna F;-hez. Az fék 
Színezése előtt X;-ből nem megy ki kék él, így a kék szabály szerint f; befesthető. 

A módszer hatékonyan párhuzamosítható. Egy menetben az élek kiválasztása 
és színezése párhuzamosan végezhető. A menetek száma pedig igen kedvező kor- 
lát alatt marad. 
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Feladat: Mutassuk meg, hogy a Borűvka-módszer meneteinek száma legfeljebb 
log; n; ennyi menet után már csak egy kék fa létezhet. 


Az előzőekben bemutattuk három fontos feszítőfa-algoritmus lényegi lépéseit, 
A módszerek helyessége következik abból, hogy mindegyik a piros-kék algoritmus 
speciális esete. Ezután a Prim- és a Kruskal-algoritmusok hatékony megvalósítá- 
sával foglalkozunk. Itt az adatszerkezetek játsszák a főszerepet. 





6.6.1.  Prim módszere 





Legyen G — (V, E) egy összefüggő gráf, c : E 5 R az élein értelmezett súly- 
függvény, és V — (1,...,nk. R. C. Prim módszere egy mohó algorítmus, ami 
a piros-kék módszer részletesen kidolgozott változatának tekinthető. Azs — 1 
csúcsból indulva a kék szabály alkalmazásával lépésről lépésre bővítgetjük az $-et 
tartalmazó kék fát. A kék éleket az F balmazban tároljuk. Végül F egy minimális 
költségű feszítőfa éleit tartalmazza. A kék élek kiválasztásához hasznos lesz még 
egy U változó, ami az aktuális kék fa csúcsait tartalmazza. Kezdetben U csak az 
1-es csúcsból áll. A kék szabály alkalmazása úgy történik, hogy kiválasztjuk azon 
élek közül a legkisebb költségűt, melyek egyik végpontja T-beli, a másik pedig 
V.VU-beli. Vagyis mondhatjuk, hogy az U-hoz legközelebbi , külső" csúcsot je- 
löljük ki. Ezt a csúcsot [-ba, a kiválasztott élet pedíg a fokozatosan növekvő kék 
fába tesszük, 





procedure Prim (G: gráf; var F: élek halmaza); 
var 
U: csúcsok halmaza; 
4, V: csúcsok; 
begin 
F:sz0; 
U:n (14 
while U  V do begin 
(4) legyen (u, v) egy legkisebb súlyú olyan él, 
melyre ve Vésv e VAN U; 
F:- FUf(uw)k 
U:-UUí(v) 
end 
end 








A Prim-algorítmus helyessége, vagyis hogy végül F a G gráf egy minimális 
költségű feszítőfájának éleit tartalmazza, következik a piros-kék algoritmus ha- 
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sonló tulajdonságából. A következő rajzon egy súlyozott élű irányítatlan gráf tát- 
ható. Az egyetlen minimális költségű feszítőfájának az éleit megvastagítottuk. 


Ha Prim módszerével a vi csúcstól indulunk, akkor a pontok a 
01, 02, V5, Va, 03. 06 sorrendben kerülnek be az [7 halmazba. Ennek megfelelően F- 
be először a (vi, va) élet vesszük, amit (v2, vs), (vs, va), (2, vs) és végül (vs, ve) 
követ. 

Ezután a Prim-algoritmus megvalósításának finomabb részleteivel! foglalko- 
zunk. 


Naiv implementáció: 





Tegyük fel, hogy a gráf az élsúlyokat tartalmazó C adjacencia-mátrixával" adott. 
A (4) sor megvalósításához minden lépésben ki kelt tudjuk választani az épp ak- 
tuális U és V 4 U halmazok közt futó legkisebb súlyú élek egyikét. Az összes él 
megvizsgálása nyilván nagyon sok időt venne igénybe. Ezért minden V § U-beli 
csúcshoz tároljuk, hogy milyen messze van az U halmaztót, vagyis a belőle az U 
halmazba futó élek közül egy minimálisnak a súlyát. Tartsuk még nyilván ezen 
élek U-beli végpontját is. Erre szolgál a következő két tömb: 
25 ak hajeU 
KÖZEL[í] — Ai a ; 

Lt] ( egy az í-hez legközelebbi [-beli csúcs . hai € VAU 

4 haie/ 


MINSÜLYÍ] — ( CTi.j) ha KÖZEL[] —j 4 


A következő kék él az (i, KÖZEL[I]) élek közül kerül majd ki. Ezért ezeket 
az éleket kékes éleknek nevezzük. Kezdetben U — (1). Ennek megfelelően a 
kezdőértékek: 





FEGRNNNNNNNN 
Mint ahogy a Dijkstra-algorítmusnál. itt ís fellesszük, hogy Cfi,j) — oo, ha (i,j) nem éle 
G-nek. 
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KÖZEL :— (i it 


k haí-1 
CÍ] haigi 


Ezek után a (x) sor teendőit így valósíthatjuk meg: 


MINSÚLYÍ;] :z ( 


6 A következő kék él kiválasztása: megkeressük a MINSÚLY[/ ] tömb mi- 
nimumát, vagyis a legrövidebb kékes él hosszát. Mondjuk ez legyen k- 
nál. A minimumkeresés költsége: O(n) elemi lépés. Nyilvánvaló, hogy a 
V 4 U-beli csúcsok közül k egyike az U-hoz legközelebbieknek. Tehát az 
(u, v) él lehet a (KÖZELIK], k) él; ezt fogjuk F-be tenni, k-t pedig U-ba. 
Ennek megfelelően a két tömb k-hoz tartozó értékét r-ra kell állítanunk: 
MINSÚLYÍ[K) :— KÖZELIK) :— x. E teendők időigénye 0(1)). 


e A két tömb felfrissítése: (Erre azért van szükség, mert az U halmaz bővült 
k-val. Így elképzelhető, hogy valamely V 4 U-beli csúcshoz tartozó töm- 
bértékeket meg kell változtatni, mert a csúcs közelebb van k-hoz, mint bár- 
mely régi U-beli csúcshoz.) Ehhez a C(k,í]) és a MINSÚLY[-] értékeket 
(i € V. VU) kell összevetni. Ez 0(n) költséggel megtehető a következő 
kódrészlet végrehajtásával (minden í € V ) U pontra): 


if KÖZEL[Í] 7 § and CÍk, i) c MINSÚLY[-] then begin 
KÖZEL[] :— ki; 
MINSÚLY [í] 





Mindent egybevetve. a while-ciklus belsejének végrehajtása 0(n) időt tesz ki. Mi- 
vel a ciklus n-szer fut le, az algoritmus összidőigénye naiv implementáció esetén 


0(n2). 


Kupacos-éllistás implementáció: 


Ha a gráfunk viszonylag ritka, vagyis az élek száma jóval kevesebb, mint n?, ak- 
kor érdemes éllistát használni a gráf tárolására, és az algoritmust a következőképp 
megvalósítani. 

A. while-ciklus magjának minden egyes lefutásakor azon élek közül kell a mi- 
nimális súlyút kiválasztanunk, melyek egyik végpontja U-ban, a másik V 4 U-ban 
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van. Az U halmaz bővítése után lesznek újabb ilyen tulajdonságú élek, ezeket 
hozzá kell venni a többihez (nem törődünk az esetleg ottmaradó most már U-n 
belüli élekkel). Vagyis MINTÖR és BESZÚR műveleteket kell hatékonyan imp- 
lementálnunk, amihez a kupac adatszerkezet lesz segítségünkre. Tehát építsünk és 
tartsunk fenn kupacot az U és VST közti élekből (rendezés élsúly szerint). Ez kez- 
detben csak az 1-es csúcsból kiinduló éleket tartalmazza. Ezek után a ciklus belse- 
jében az (u, v) él kiválasztása néhány MINTÖR művelettel megvalósítható. Azért 
néhánnyal és nem feltétlenül eggyel, mert nem foglalkozunk külön azoknak az 
éleknek a kupacból való törlésével, melyeknek egy csúcs hozzávétele után mind- 
két végpontja U-beli tesz. Így a MINTÖR eredményeképp kaphatunk ilyen élet ís. 
Ilyenkor újabb MINTÖR-rel próbálkozunk, míg nem találunk U-ból kimenő élet. 
A következő kék él meghatározása után BESZÚR műveletekkel hozzávesszük a 
kupachoz a kiválasztott v csúcsból a V ) U halmazba menő éleket. 
A kupac mérete sosem haladja meg e-t. Ezért a kezdeti kupacépítés legfeljebb 
0O(e), az egyes műveletek végrehajtása pedig O(1og e) időt vesz igénybe. Össze- 
sen kevesebb, mint e darab BESZÚR és legfeljebb e darab MINTÖR műveletet 
végzünk. Tehát az algoritmus költsége itt O(elog e). Mint ahogy azt megjegyez- 
tük, a kupacos-éllistás implementációt kevés élet tartalmazó gráfoknál érdemes 
használni. 











Johnson módszere: 





A következő -— D. B. Johnsontól származó — elképesztően erőteljes implemeni 
merít a két előző megközelítés gondolataiból. Nyilvántartjuk egyrészt a kékes éle- 
ket, mint ahogy azt a naiv implementációnál tettük; másrészt kupacot használunk 
a minimum kíválasztására, A j € V § U csúcshoz tároljuk égy belőle kiinduló 
kékes él adatait. Erre a célra egy [ 7 I í ] eli, 3) ] szerkezetű cellát állítunk össze. 
Itti egy a j-hez legközelebbi U-beli csúcs, a c(i, j) pedig az (i, j) kékes él súlya. 
A cellákat a c-érték mint kulcs szerint d-kupacban tartjuk. Először csak az 1-es 
csúcsból kimenő élek végpontjainak cellái lesznek a kupacban. Kezdetben tehát a 
kupac al j[ 1] e(1,j) Jalakú cellákból ált, ahol (1, j) éle G-nek. 

A kupac létrehozásának (kupacépítés) a költsége O(n). A Prim-algorítmus (r) 
sorában a kékre festendő (u,v) él meghatározása egy MINTÖR-rel megtehető. 
Ezután — a naiv változathoz hasonlóan — gondoskodnunk kell a kékes élek hal- 
mazának a frissítéséről. Ehhez meg kell vizsgálnunk a v éltistáján szereplő (v, w) 
éleket. (Itt v az U halmazba éppen bekerült csúcs, ezért a belőle kimenő élek szóba 
jöhetnek mint kékes élek.) Ha most w € U, akkor nincs további teendőnk ezzel az 
éllel. Ha w g U, akkor két eset lehetséges. Előfordulhat egyfelől, hogy w-ből ed- 
dig nem ment él U-ba. Ekkor (v, w) nyilván egy kékes él lesz. Ennek megfelelően 
égy BESZÚR művelettel a[ w [d ] elv, w) ] cellát a kupacba tesszük. Másfelől 
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az is lehetséges, hogy w-ből már megy ki kékes él, de a (v, w) él ennél rövidebb. 
Ezt annan látjuk, hogy a w cellája a kupacban van, és a benne levő súly nagyobb, 
mint cív, ww). Ekkor a cellát átírjuk, aminek az eredménye ( wfv] cív,w) tesz. 
A módosított cellában a kulcs értéke csökkent, tehát egy FOGYASZT segítségével 
illeszthetjük vissza a kupacba. Ezek a módosítások a G éleihez köthetők. Egy él 
kapcsán legfeljebb egyszer módosítunk; mégpedig akkor, amikor egyik végpontja 
éppen bekerül U-ba, és a másik nincs U-ban. A fogyasztások száma tehát legfel- 
jebb e. A beszúrások száma pedig legfeljebb n — 1, hiszen egy csúcs cellája legfel- 
jebb egyszer kerül a kupacba. Figyelembe véve, hogy a kupacban legfeljebb n— 1 
cella van, a műveletek költsége összesen 0(n -- ndlogyn 4 nilogyn 4 eloggyn). 
Az első tag a kupacépítés, a második az n —1 darab MINTÖR, a harmadik a beszú- 
rások, az utolsó pedig a fogyasztások lépésszáma. A formula hasonlít a Dijkstra- 
módszer d-kupacos változatának elemzésénél kapott kifejezéshez. Hasonló a kö- 
vetkeztetés is, amit levonhatunk belőle. Tegyük fel, hogy G nem túl ritka, mond- 
juk 1! £ e. Legyen ekkor d — [e/n]. Nyilvánvaló, hogy d 2 vn, amiből 
lögyn £ 2. Ezt figyelembe véve 


























O(n3-ndlogyan 4 nlogymn-telogyn) — Oíntndi4n-ie) 
—- O(ln4n-efn4 nt e)— Ofe). 


Viszonylag sűrű gráfok esetén tehát a kupacműveletek összköltségére lineáris kor- 
látot kaptunk. 

Maradt még egy elvarratlan szál. A w csúccsal a kezünkben gyorsan el kell 
tudnunk dönteni, hogy az már/még a kupacban van-e; ha ígen, akkor meg kell ta- 
lálni a celláját. Ezt egy MERRE[2 : n] tömb segítségével egyszerűen megtehetjük. 
Legyen MERRE[w] — oo, ha w cellája még nincs a kupacban, és legyen a, ha 
w már U-ba került. Ha pedig a w cellája a kupacban van, akkor MERRE[4) le- 
gyen egy mutató erre a cellára. A tömb segítségével a w-vel kapcsolatos döntés 
konstans időben meghozható. A tömb karbantartásához szükséges munka 0(e). 
Ez azért igaz, mert egy kupacművelet után állandó mennyiségű munkával aktua- 
lizálható a tömb; a kupacműveletek száma pedig 0(e). A Johnson-implementáció 
tehát lineáris költségű. ha G viszonylag sűrű (nt £ e) gráf. 


6.6.2. . Kruskal módszere 


Legyen továbbra is G — ((, E) egy összefüggő gráf, c : E — R az élein értel- 
mezett súlyfüggvény, és V — (1, . . . ,n). Kruskal algoritmusa, mely G egy mini- 
mális költségű feszítőfáját konstruálja meg, szintén egyfajta mohó stratégiát követ. 
Míg Prim módszerénél egyetlen kék fát növesztettünk, itt több helyen kezdjük el 
építgetni, és kapcsoljuk fokozatosan össze a még diszjunkt darabokat. A piros éle- 
ket figyelmen kívül hagyva elmondhatjuk, hogy a kék élek F halmazát bővítjük a 
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legkisebb súlyú olyan éllel, amely az eddig kiválasztott élekkel együtt nem alkot 
kört. Nyilván egy ilyen él két diszjunkt kék fát köt össze. A kiinduló helyzetben 
n egypontú fánk van. Minden lépésben a legkisebb súlyú, kört nem okozó él hoz- 
závételével a kék komponensek száma eggyel csökken. Így n — 1 él kiválasztása 
után egyetlen kék fa lesz, nevezetesen G egy minimális költségű feszítőfája. Nagy 
vonalakban ez így írható le (H kezdetben a gráf összes éleinek halmaza): 


procedure Kruskal (G: gráf; var F, H: élek halmaza); 
begin 
Ft HE 
while H 6 do begin 
Töröljük a H minimális súlyú (v, w) élét. 
Ha F U ((v. w))-ben nincs kör 
(azaz a v, ww pontok különböző kék fákban vannak), akkor 
F:— FU((vw) 
end 
end 


Ha tehát a ív, w) él kört eredményez, akkor eldobjuk (piros él), ha pedig nem, 
akkor bevesszük a feszítőfa (kék) élei közé. Mint korábban láttuk, a Kruskal- 
módszer is a piros-kék algoritmus egy változata. Érvényes tehát a következő: 


Állítás: A Kruskal-algoritmus eredményeként végül F a G gráf egy minimális 
költségű feszítőfájának éleit tartalmazza. DO 


Az előző példa gráfjára alkalmazva a Kruskal-algoritmus először a (va, vs) És 
a (va, vs) éleket választja valamilyen sorrendben; utána a minimális feszítőfa 2 
súlyú élei jönnek és végül a (vs, vs) él. 


Ezután itt is a hatékony implementáció részleteinek kimunkálásával foglalko- 
Zunk. Feltesszük. hogy G éllistával adott. A minimális élek kiválasztására az egyik 
lehetséges megoldás, hogy a G éleiből súly szerint kupacot építünk (költség 0(e)). 
Ez esetben a minimális súlyú él kiválasztása, és a kupac-tulajdonság helyreállítása 
O(log e) időbe kerül. Ha tehát H-t kupacként valósítjuk meg, akkor a vele kapcso- 
latos összköltség 0(e log e) lesz (kupacépítés és legfeljebb e MINTÖR). Ugyan- 
ébben a nagyságrendben maradunk, ha az éleket előzetesen rendezzük súly szerint, 
és az eredményül kapott rendezett lista lesz a H. 

Már csak egy fontos kérdés maradt hátra: hatékony megoldás kellene annak az 
eldöntésére, hogy a kiválasztott (v, w) él az F eddigi éleivel kört alkot-e. E döntés 
eredményétől függően lesz az él piros vagy kék. Tartsuk nyilván az aktuálisan egy 
kék fába tartozó csúcsokat mint halmazokat. Kétféle műveletre lesz szükségünk. 
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Amikor a két különböző fát összekötő élet hozzávesszük F-hez (vagyis kékre szí- 
nezzük), akkor a megfelelő két halmaz unióját kel! képeznünk, hiszen ezekből így 
egyetlen összefüggő komponens lesz. Ahhoz pedig, hogy eldöntsük egy élről, hogy 
két különböző kék fát köt-e össze, az egyes végpontokról meg kell tudnunk mon- 
dani, hogy melyik halmazban vannak. Ezen műveletek hatékony megvalósítását 
szolgálja a következő adatszerkezet. 


6.6.3. Az UNIÓ-HOLVAN adatszerkezet 


Legyen adott egy véges 5 halmaz. Ennek egy felosztását — szakszóval: partícióját — 
szeretnénk tárolni. Emlékeztetőül: a nem üres Uj , . . . , Vg C § halmazok az S egy 
partícióját alkotják, ha U$.. U; — § és í 5 j esetén U; NU; — 0. Az U; halmazok 
tehát hézagtalanul és egyrétűen lefedik S-et. Két műveletünk van. Egyre E § 
esetén meg kell tudnunk mondani, hogy az c melyik Uj; részhalmazba esik. A 
másik művelet a partíció két osztályának az egyesítése. Valamivel formálisabban: 


Adott egy n elemű S halmaz, és ennek bizonyos Ú] , . . . , Um részhalmazai, 
melyekre U;NU; —D(i A j) és UL U... UUn — § (vagyis az Uj 
részhalmazok §$ egy partícióját adják). 

Műveletek: 

UNIÓ(U;, U;) — ((U, . . . , Un) U (U; U U;)) V(U Uj) (az U;, U; hal- 
mazokat U; U U; helyettesíti). 

HOLVAN(v) eredménye (itt v € 5) annak az U; halmaznak a neve, amely- 
nek v eleme. 


Egy UNTÓ hatására a felosztás durvább lesz, minthogy eggyel csökken a kompo- 
nensek száma. Az UNIÓ-HOLVAN adatszerkezet nevezetes alkalmazásainál több 
UNIÓ és HOLVAN műveletből álló lépéssor végrehajtására van szükség abból a 
kezdőhelyzetből indulva, amelyben mindegyik U; egyelemű. Mi is élünk ezzel a 
feltevéssel. 

Kruskal algorítmusában tényleg valami ilyesmire van szükség: legyen ugyanis 
S z V(G). az U; halmazok pedig az F által meghatározott kék gráf fáinak 
a csúcshalmazai. Az éppen vizsgált (v,w) él az F-hez adva pontosan akkor 
nem eredményez kört, ha a végpontok különböző komponensben vannak. azaz 
HOLVAN(v) / HOLVANÍíw). A körmentesség tehát két HOLVAN kérdéssel el- 
lenőrizhető. Miután a (v,w) élet F-be tettük, egyesítenünk kell a v-t és a w-L 
tartalmazó kék fákat. Ezt egy UNIÓ művelettel érhetjük el. Az induló feltétel is 
teljesül, ugyanis kezdetben n darab egypontú fánk van. 

Célunk tehát az UNIÓ és a HOLVAN műveletek hatékony implementálása. 
A legegyszerűbb út, ha felveszünk egy n hosszú tömböt, és S minden eleméhez 
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tároljuk, hogy aktuálisan melyik részhalmazban van. Ekkor egy HOLVAN vég- 
rehajtása 0(1), egy UNIÓ pedig n-nel arányos időt vesz igénybe. Az előbbinél 
a tömb egy elemét kell lekérdeznünk, az utóbbinál pedig végig kell mennünk a 
tömbön, és a megfelelő két halmaznevet azonosra változtatnunk. Ennél azonban 
létezik lényegesen hatékonyabb megoldás is. 


Implementáció fákkal 


Egy U; részhalmaznak egy gyökeres, felfelé irányított fa felel meg. U; elemeit a 
fa csúcsaiban tároljuk, egy szülőmutatóval együtt (ami egy nullértéket tartalmaz a 
gyökérnél). Egy részhalmaz neve legyen az őt ábrázoló fa gyökere. A gyökérben 
nyilvántartjuk még a fa méretét is. Van továbbá egy S elemeivel indexelt tömbünk. 
Ennek a v indexű (v € 5) eleme egy mutató a v fabeli előfordulására. A műveletek 
megvalósítása: 


s UNIÓ: U;U U; fáját a következőképpen készítjük el: 


Tegyük fel, hogy IU;] c JU]. Ekkor az U; fa z gyökeréhez gyermekként 
hozzákapcsoljuk U; gyökerét. 


AA 6 


e. HOLYAN: A v € 5 elemet tartalmazó részhalmaz nevét, azaz a megfelelő 
fa gyökerét a szülőkhöz menő mutatók végigkövetésével találhatjuk meg. 
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Tegyük fel, hogy az UNIÓ hívásakor az U; és U; halmazok a gyökerükkel adot. 
tak (ez a feltevés valós a Kruskal-módszernél). Az UNIÓ költsége ekkor nyilván 
0(1), hiszen a gyökereknél adminisztráljuk az egyes fák méretét, és csak a kiseb- 
bik fa gyökerének szülőmutatóját kell átállítanunk. Vegyük észre, hogy amikor egy 
v csúcs új gyökér alá kerül, akkor egy szinttel lesz távolabb a gyökértől, míg az új 
fájának a mérete legalább az eredeti duplájára változik. Ezért egy csúcs legfeljebb 
log; n-szer kerülhet új gyökér alá, így a szintszámá! legfeljebb log; n lehet. Eb- 
ből adódik, hogy a HOLYAN költsége O(log n). Ha nem vigyáztunk volna, hogy 
mindig a kisebb fát kapcsoljuk a nagyobbhoz, akkor a fa mélységére nem tudnánk 
ilyen korlátot adni; a HOLYAN költsége akár n-nel arányos is lehetne. Vegyük 
észre azt is, hogy ebben az elemzésben használtuk a kezdeti partícióval kapcsola- 
tos feltételezést. 

Kruskal algoritmusában egy él mindkét végpontjáról egyszer kérdezzük le, 
hogy melyik komponensben van. Összesen n — 1 élet választunk be a feszítő- 
fába. Ez tehát 2e HOLVAN, és n — 1 UNIÓ műveletet jelent. Ezek időigénye 
O(elogn-- n) — O(elogn), vagy ami ugyanaz: 0(e log e). Ebbe belefér a kiin- 
dulási helyzetet jelentő n egypontú fa kialakításának az O(n) költsége is. Ugyan- 
csak O(elog e) az összköltsége a minimális súlyú élek kiválasztásával kapcsolatos 
munkáknak. akár kupacot használunk, akár előzetesen rendezzük az éleket. 





Következmény: A Kruskal-algoritmus költsége 0(elog e). C 


Az UNIÓ-HOLVAN adatszetkezetet eddig jórészt afféle , individualista" szemlé- 
lettel néztük, amennyiben az egyes műveletek egyetlen végrehajtásának az idejére 
adódó korlátokkal foglalkoztunk. Valójában az érdekes alkalmazásoknál nem egy. 
hanem egy egész sor UNIÓ-t és HOLVAN-t kell végrehajtanunk. Ilyenkor érdemes 
lehet a hosszabb műveletsorok idejét javítani. Az elgondolás hasonlít az 5-fáknál 
és az önszervező tábláknál látottakhoz: amikor egy HOLVAN kérdést megválaszo- 
lunk, akkor némi további munkával igazítunk az éppen elért fa alakján azt remélve. 
hogy ez a befektetés később megtérül. Ebben nem is csalatkozunk. 


A HOLVAN gyorsítása: útösszenyomás 


Az UNIÓ és a HOLVAN műveletek közül az utóbbi a költséges; ennél érdemes ta- 
karékoskodni az idővel. A HOLVAN(v) időigénye a v-től a fája gyökeréig vivő úl 
hosszával arányos. Ha tehát gondoskodunk arról, hogy az elemek viszonylag közel 
legyenek a gyökérhez, akkor jobb időket kaphatunk. Egy ilyen ötlet az útös 
nyomás. Ennek lényege, hogy HOLVANÍv) meghívása esetén v fájában a v-től a 
gyökérhez vezető út minden pontját közvetlenül a gyökér alá csatlakoztatjuk át 





Egy csúcs szintszáma a tőle a gyökérig vezető úton levő élek száma. 
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Ezt legegyszerűbben úgy tehetjük meg, hogy még egyszer végigmegyünk ezen az 
úton, és átállítjuk a szülőmutatókat, Így egy kis pluszmunkával javítunk a fa alak- 
ján. AZ Ti csúcsok és a leszármazottaik közelebb kerülnek a gyökérhez. 


gyökér gyökér 


41 72 ZM TA 








Az útösszenyomást alkalmazó implementáció időigényének a becslése megle- 
hetősen bonyolult; csak az eredményt ismertetjük. 


Tétel: Legyen IS] — n, és tegyük fel, hogy kezdetben mindegyik Uj egyelemű. 
Ha egy olyan utasítássorozatot hajtunk végre fútösszenyomássa!), melyben n— 1 
UNIÓ és m 2 n — 1 HOLVAN szerepel, akkor ennek az időigénye O(malm)). 


A korlátban szereplő a : Zt GZ függvény az inverz Ackermann-függvény. 
Az a cirkalmas definíciójától eltekintünk. Csak annyit jegyzünk meg róla, hogy 
alm) a végtelenhez tart, ha m — oo, ezt azonban a képzeletet jócskán próbára 
tevő lassúsággal teszi. Lassabban nő például, mint a logaritmus k-szori önmagába 
helyettesítésével adódó log log - . - log m függvény (k € Z7 tetszőleges). Igaz t0- 
vábbá, hogy a(m) £ 4, ha m a 25536 A praktikus méretű feladatoknál tehát 
a(m) állandónak (£ 4) tekinthető. 


A Kruskal-algoritmussal kapcsolatos teendők két csoportba sorolhatók. AZ 
egyik csoportot a minimális élek választásai jelentik, a másikat pedig az UNIO- 
HOLVAN kezelése. Az első csoport összköltségére 0(e log e) korlátot kaptunk. 
Gyakran előfordul azonban, hogy ezek a rendezéssel kapcsolatos teendők 0(e) 
lépésben is megoldhatók. Ilyen helyzet például, amikor az élsúlyok kis egészek, 
és ezért az élek a radix-módszerrel lineáris időben rendezhetők. Az is megeshet, 
hogy a bemenetben már eleve rendezetten kapjuk az éleket. Ezekben az esetekben 
az általánosnál jobb korlátot nyerünk. 


Alkalmazás: Ha az élek rendezésével kapcsolatos teendők 0(e) időben megold- 
hatók, akkor a Kruskal-algorimus O(ea(e)) időben megvalósítható. 





Bizonyítás: A második csoportba tartozó teendőkre alkalmazható a tétel: n -1 
UNIÓ-t és legfeljebb 2e HOLVAN-t hajtunk végre, A feltétel szerint az összköltség 
becslésében a domináns tag az e műveletekre vonatkozó O(eate)) lesz. 0 
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6.6.4. "Megjegyzések 


1. Az általunk szemügyre vett algoritmusok (Borúvka, Prím és Kruskal módszerei) 
az élsúlyokkal csak összehasonlításokat végeznek. Nem vizsgálják például a bitje. 
iket, nem adják össze őket, stb. Izgalmas nyitott kérdés, hogy van-e az ilyen érte- 
lemben összehasonlítás alapú algoritmusok között lineáris költségű. Köze! lineáris 
módszerek léteznek. A Borűvka-módszernek például van O(elog log n) költségű 
megvalósítása (A. C. Yao, 1975). A Tin. dőkorlát elérhető véletlen választá- 
sokkal (D. R. Karger, P. N. Klein, R. E. Tarjan, 1994). Módszerük várhatóan 0(e) 
lépésben talál egy minimális költségű feszítőfát. 

M. Fredman és D. E. Willard (1990) módszere lineáris idejű ugyan, de kulcs- 
manipulációs jellegű, amennyiben az élsúlyok bitjeivel is végez számításokat. 

Érdekes kapcsolódó eredmény, hogy ha adott G és annak egy F élhalmaza, 
akkor lineáris időben eldönthető, hogy F minimális költségű feszítőfa-e (Komlós 
János 1985, V. King 1993). 

2. A minimál tőfák problémájának több figyelemre méltó rokona é: 
tozata van. Ezekből most két feladatban mutatunk mintát. Az első a probléma ort- 
line változatáról szól. Tegyük fel. hogy a G éleit egyesével kapjuk valamilyen sor- 
rendben, és szeretnénk gyorsan meghatározni az eddig látott élekből álló gráf egy 
minimális költségű feszítő erdejét (amelynek az összefüggő komponensei ugyan- 
azok, mint az eddigi élekből álló gráfnak). Evégből tegyük fel, hogy az eddigi élek 
közül már kiválasztottunk egy kék feszítő erdőt, és jön a következő f él. A recept 
egyszerű: színezzük az f élet kékre; ha emiatt kialakul egy kék kör, akkor abból 
töröljünk egy maximális súlyú élet. 


























Feladat: Mutassuk meg, hogy az előző algoritmus helyes; ha az üres gráfból in- 
dolva sorra alkalmazzuk az fi, fo, ..., fs élekre, akkor a kék élek halmaza az 
fi fax... fi élekből álló G; gráf egy olyan minimális költségű feszítő erdeje 
lesz, amelynek ugyanannyi összefüggő komponense van, mint G;-nek. Speciális 
esetként: ha G összefüggő, akkor végül — amikor már G minden élét láttuk — egy 
minimális feszítőfát kapunk. (Használjunk í szerinti indukciót.) 





Egy feszítőfa költségét úgy definiáltuk, hogy az a benne szereplő élek súlya- 
inak az összege. Bizonyos esetekben másféle költségszámítás is értelmes lehet. 
Például egy fa költségeként értelmezhetjük a legnagyobb súlyú élének a súlyát". 


t ad akkor 





Feladat: Mutassuk meg, hogy a piros-kék algoritmus minimális feszí! 
is, ha így értelmezzük egy fa költségét. 





JEz a költségfogalom merül fel, amikor az élsúlyok a csúcsok közötli kapcsolatok valamiféle 
megbízhatatlanságát mérik. A nagyobb súlyú él tehát kevésbé megbízható. A minimális feszítőfa 
ilyenkor egy olyan összeköttetés-rendszert jelent, amiben a teggyengébb láncszem a lehető ilegmeg- 
bízhatóbb. 
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6.7. . Maximális párosítás páros gráfokban 


A lovagok és udvarhölgyek problémája egyike volt bevezető példáinknak (az első 
fejezetben). Itt ennek a kérdésnek az általánosításával, a párosítási feladattal fog- 
lalkozunk. A párosítási feladatnak több fontos változata van. Ezek közös magja, 
hogy egy gráfban minél nagyobb olyan élrendszert (szakszóval: párosítást) kere- 
sünk, amelyben semelyik két élnek sincs közös végpontja. A nagy az előző mon- 
datban utalhat a kiválasztott élek számára vagy — ezen túlmenően — a kiválasztott 
élek súlyainak összegére. 

Párosítási feladatként fogalmazható meg egy sereg erőforrás-kiosztási prob- 
léma. Például tegyük fel, hogy adottak gépek és munkák véges halmazai: G és 
M. Egy gép egy időszakban csak egy munkával tud foglalkozni. Ismert továbbá, 
hogy egy gép mely munkák elvégzésére alkalmas. Szeretnénk egy időszakban mi- 
nél jobban kihasználni a gépeket: minél több géphez akarunk munkát rendelni úgy, 
hogy ne sértsük meg az előző feltételeket. A problémának megfelelő gráf ponthal- 
maza G UM. A g € G gépet akkor köti él az m € M munkához, ha g képes az m 
elvégzésére. A megoldások a gráf maximális élszámú párosításai. 

A következőkben a párosítási feladat legegyszerűbb esetével foglalkozunk, 
amikor is a szóban forgó gráf páros, és nincsenek élsúlyok (vagyis minden élsúly 
1). Lássuk először az idevágó fogalmakat: 








Definíció (páros gráf): A G — (V, E) gráfor párosnak nevezzük, ha V csúcshal- 
maza felosztható kér diszjunkt részre — V1 -re és V2-re — úgy, hogy minden él ezen 
két halmaz között fut, vagyis (x,y) E E esetén x E Vi és y € V2 vagy fordítva. 


Ha egy G — (V, E) páros gráfot úgy adunk meg. hogy G — (V1, V2; E), akkor V1 
és V5 a fenti tulajdonságú partíciója a V-nek. 

Definíció (párosítás): Legyen G — (V, E) egy tetszőleges gráf. Az E élhalmaz 
E G E részhalmaza G egy párosítása, ha a G" — (V, E") gráfban minden pont 
foka legfeljebb egy. 





A párosításban szereplő éleket, illetve a párosítás által fedett pontokat (vagyis me- 
lyek foka G-ben egy) párosítotrnak fogjuk hívni. 


Definíció (maximális párosítás): A G eráf egy E" párosítása maximális, ha G 
Minden E" párosítására JE"I £ 1E"1. 


Ezek után megfogalmazhatjuk pontosan a feladatot: 


A probléma: Adott egy G — (V1, Va; E) páros gráf. Határozzuk meg G egy 
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6.7.1. A magyar módszer 


Az itt bemutatásra kerülő algoritmus első változatát König Dénes" közölte 1916- 
ban. A módszert König Dénes és a súlyozott feladatot megoldó Egerváry Jenő tisz- 
teletére nevezik világszerte magyar módszernek. A következő két fogalom elvezet 
bennünket az algoritmus lényegéhez. 


Definíció (alternáló út): Legven G egy tetszőleges gráf. és E" a G egy párosítása, 
Egy G-beli utat E"-alternáló útnak hívunk, ha felváltva tartalmaz párosított és nem 
párosított éleket. 





Ha a G gráf egy adott E" párosításához találunk olyan P alternáló utat, amely 
két különböző párosítatlan csúcsot köt össze, akkor ez az út párosítatlan éllel kez- 
dődik és fejeződik be. P-nek tehát eggyel kevesebb párosításbeli éle van, mint 
nem párosításbetli, Ezért az E7-nél jobb párosítást kapunk, ha elhagyjuk belőle a P 
út eddig párosított éleit, de hozzávesszük az eredetileg párosítatlanokat. Az ilyen 
tulajdonságú utat. melynek segítségével javítani tudunk egy meglévő párosításon, 
javító útnak nevezzük. Formálisan: 








Definíció (javító út): Legyen E" a G — (V, E) gráf egy párosítása. Ekkor egy 
olyan E" -alternáló út, melynek mindkét végpontja párosítatlan, E"-re nézve javító 
út, vagy röviden E"-javító út. 


Arra jutottunk, hogy ha a G gráfban adott egy E" párosítás és egy P út, mely 
E"-javító út, akkor az E" — E" 9 P egy az E/-nél nagyobb párosítás. Ítt 6 a 
halmazok körében értelmezett szimmetrikus differencia műveletét jelöli (a P utat 
ilyenkor élek halmazaként fogjuk fel). Két halmaz szimmetrikus differenciája az a 
halmaz, melynek elemei a két halmaz valamelyikében szerepelnek, de mindkettő- 
ben nem: 


Jelölés (szimmetrikus differencia): Legyenek Hi, H? tetszőleges halmazok. 


HM 8 H2 - (Hi VHo)U(H2N Ha). 


"König Dénes (1884-1944) a Budapesti Műszaki Egyetem tanára volt. A Theorie der endlichen 
und unendíichen Graphen című. 1936-ban Lipcsében megjelent munkája az első könyv, amely rend- 
szerbe foglalva tárgyal gráfokkal kapcsolatos ismereteket. A gráfelmélet ettől kezdve tekinthető ön- 
álló tudományos témának. A mű fontosságát jelzi, hogy 1959-ben reprint kiadása született az Egye- 
sült Áltamokban, 1990-ben pedig angolra fordították. Tudomásunk szerint ő hirdetett meg először 1 
történelemben gráfelméleti tárgyú egyetemi előadást; ez az 1927/28-as tanévben történt. 

A tudósportré mosolygós vonásaként említhetjük a Mathematikai mulatságok címmel 1902-ben 
és 1905-ben megjelent két könyvecskéjét. Ezekben a gyűjteményekben érdekes matematikai rejtvé- 
nyeket adott közre. A feladatok szépsége, a magyarázatok áttetsző tisztasága teszi őket nagyszerű 
olvasmánnyá. A két füzetet 1992-ben ismét kiadták (fypolex Kft.). 
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Ezek alapján az algoritmus úgy néz ki, hogy kiindulunk valami könnyen szer- 
zett párosításból (ez lehet üres is), és minden lépésben az aktuális párosításra nézve 
keresünk egy javító utat. A javító út mentén egy nagyobb párosítást kapunk. De mi 
van akkor, ha már egy párosításhoz nem találunk javító utat? A következő tétel 
pont azt mondja ki, hogy ekkor nyugodtan megállhatunk, mert az aktuális párosí- 
tásunk már maximális. 











Tétel: Legyen G — (V, E) egy tetszőleges gráf és E" egy párosítása. Ha E"-re 
nézve nincs javító út G-ben, akkor E" a G egy maxünális párosítása. 


Bizonyítás: Legyen M a G egy tetszőleges maximális párosítása. Vizsgáljuk meg 
aG! - (V, Ev ő M) gráfot. Minden pontra mindkét párosításban legfeljebb egy él 
illeszkedhet, ezért G"-ben minden pont foka legfeljebb kettő. Ez azt jelenti, hogy 
G! komponensei utak és körök, amelyek felváltva tartalmaznak E"-beli és M-beli 
éleket. Így a körök csak páros hosszúak lehetnek, vagyis mindkét párosításból 
ugyanannyi él szerepel bennük. A feltétel szerint egyik út sem lehet E"-javító, 
M maximális volta miatt pedig egyik sem lehet M-javító. Ezért G"-ben minden 
út páros hosszúságú, és mindkét párosításból ugyanannyi élet tartalmaz. Ebből kö- 
vetkezik, hogy [7] — IMI, vagyis az E" párosítás is maximális. O 


Már csak az maradt hátra, hogy megmutassuk, miként lehet egy gráf egy adott 
párosításához javító utat találni. Vegyük észre, hogy az előző tétel nem csak páros 
gráfokról szólt. A javító út keresésénél azonban már lényegesen kihasználjuk G 
Páros voltát. Egy G — (V1, Va; E) páros gráfban meg tudjuk adni a csúcsok egy 
olyan halmazát, melyben a lehetséges javító utaknak pontosan az egyik végpontja 
szerepel, Például Vy ilyen lesz, hiszen egy páros gráfban minden javító út — mivel 
Páratlan hosszú — egy Vi és egy V2-beli pontot köt össze. 

A javító út kereséséhez egy alternáló erdőt növesztünk. Ennek csú szin- 
tekre osztva érdemes elképzelni. A nulladik szinten a 44-beli párosítatlan csúcsok 
Vannak. Ezután szintről szintre növesztgethetjük a lehetséges javító utakat úgy, 
hogy felváltva veszünk fel párosítatlan és párosított éleket. Az egyre bővülő gráf 
egy erdő lesz, melynek szintjein felváltva szerepelnek V1-beli és [2-beli pontok. 
Ha valamelyik páratlan szinten megjelenik egy még párosítatlan v csúcs, akkor 
jtó utat találtunk. Az erdőben a v-től a nulladik szintre visszavivő út javító út 
esz. 








Javító út keresése alternáló erdő építésével 


Adott a G — (V1, Va; E) páros gráf, és egy E" párosítása. Egy az E"-hez tartozó 
alternáló erdőt a következő módon, szintről szintre haladva építhetünk fel: 
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0. szint: VI azon pontjai, melyeket E" nem fed le, vagyis a 
párosítatlan pontok. 


2k—1. szint:  V2 azon még fel nem vett pontjai, melyek egy pá- 
rosítatlan, azaz egy EY E"-beli éllel elérhetők egy 
2k — 2. szintbeli pontból; ezen éllel együtt. 


2k. szint: VI azon még fel nem vett pontjai, melyek egy 
párosított, azaz egy F"-beli éllel elérhetők egy 
2k — 1. szintbeli pontból; ezen éllel együtt. 


Egy csúcsot legfeljebb egyszer veszünk fel, mégpedig az első lehetséges szín- 
ten. A kialakuló gráfban nincs kör, hiszen egy csúcshoz az alacsonyabb sorszámú 
szintekről csak egy él illeszkedik, A fa növesztése könnyen megvalósítható a szé- 
lességi bejárás kis módosításával. Induláskor a nulladik szint pontjait tesszük a 
0 sorba. Ezután pedig a bejárás során a páros szintről induló élek közül csak a 
párosítatlanokkal foglalkozunk; a páratlan szintről indulók közül pedig csak az 
F/-beliekkel. Ha tehát G éllistával adott, akkor az alternáló erdőt 0(e) költséggel 
megkaphatjuk. 


ÁMítás: A G — (Vi, Va; E) páros gráfban akkor és csak akkor van az E" párosí- 
tásra nézve javító út, ha az E"-hez tartozó alternáló erdőben valamelyik páratlan 
szinten megjelenik egy párosítatlan pont, 





Bizonyítás: Az elégségesség nyilvánvaló, ugyanis egy páratlan szinten levő páro- 
sítatlan pontot az erdőben a nulladik szinttel összekötő út egy javító út. 

A fordított állításhoz először megmutatjuk, hogy a VI párosítatlan csúcsaiból 
(ezek vannak az erdőben a nulladik szinten) alternáló úton elérhető pontok mind- 
egyikét beválasztjuk valamikor az alternáló erdőbe. Ennek igazolására tegyük fel. 
hogy vo, vo, . . . , v, egy alternáló út, és vo E Vi egy párosítatlan csúcs; í szerinti 
indukcióval megmutatjuk, hogy v; bekerül az erdőbe. Ez nyilván igaz. ha i — 0. 

Az út vaj csúcsa V1-ben van és a (vaj, vaj41) él párosítattan. Tehát ha v2;-t 
beválasztottuk, akkor v2j4.1 is bekerül, ha előbb nem, akkor a va; utáni szintre. 
Hasonló okfejtést alkalmazhatunk a páros indexű csúcsokra: az út v2j.1 CsúCSA 
V2-ben van és (v23.-1,v2j) € E. Így va; -1 után v2; is sorra kerül, ha korábban ez 
még nem történt meg. 

Tegyük fel mármost, hogy G-ben a v és w csúcsok egy javító út végpontjai. 
Ezek a pontok nyilván párosítatlanok, és egyikük — mondjuk v — a V-ben van. 
Ekkor pedig tv € V3. A v szerepel az erdő nulladik szintjén, és u-t ís be fogjuk 
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választani valamikor, hiszen v-ből alternáló úton elérhető. A w az erdőnek csak 
egy páratlan sorszámú szintjére kerülhet, mível V2-beli csúcsokat csak páratlan 
szintekre veszünk fel. 

in 

Amint azt már megállapítottuk, az alternáló erdő növesztésének költsége O(e). 
Nyilvánvaló másfelől, hogy legfeljebb n/2-szer kell javító utat keresnünk. Ezért 
a magyar módszer időigénye éllistával adott bemenet esetén O(ne). A témától 
búcsúzóban megjegyezzük, hogy vannak a magyar módszernél hatékonyabb (és 
persze sokkal kevésbé egyszerű) algoritmusok is. Ilyen például J. E. Hopcroft és R. 
M. Karp 1973-ból való módszere, ami O( /ne) lépésben talál maximális párosítást 
páros gráfokban. 


6.8. . Maximális folyamok hálózatokban 


Hempergő jóság vagy, 
termést bőséggel adj... 
RADNÓTI MIKLÓS: Himnusz a Nfiushoz 


Az emberiség történelme a kezdetektől fogva szorosan kötődik a nagy folyamok- 
hoz. Valami hasoniót mondhatunk a kombinatorikus optimalizálás és a hálózati fo- 
Íyamok viszonyáról. A hálózati folyamok természetes és meglepően gazdag mo- 
dellt kínálnak olyan helyezetek leírására, amelyek lényege, hogy egy rendszer- 
ben anyag áramlik bizonyos — forrásnak nevezett — keletkezési helyektől bizonyos 
- nyelőnek nevezett — felhasználási helyek felé. Az anyag itt ezerféle dolgot je- 
lenthet; gondolhatunk csővezetéken áramló folyadékra, elektromos; áramra, számí- 
tógépes hálózaton közvetített információra, utcákon mozgó járművekre stb. 

A hálózat egyes csomópontjai között közvetlen összeköttetések vannak; ezeket 
az anyag szállítására alkalmas médiumoknak (csővezeték, kábel, utca, stb.) tekint- 
jük. A legegyszerűbb modetiben egy ilyen kapcsolatot az irányával és a kapaci- 
tásával jellemzünk. Az előbbi mondja meg, hogy a két csomópont között milyen 
írányú áramlás lehetséges, az utóbbi pedig az időegység alatt átvihető maximális 
mennyiséget jelenti, Például egy kommunikációs vonal esetén a kapacitás lehet a 
másodpercenként átvihető bitek száma. Az anyagáramlást, a folyanot úgy képzel- 
jük el, hogy a forrásokban állandó sebességgel keletkezik az anjag, és ugyanek- 
kora sebességgel enyészik el a nyelőkben. A többi — a forrásoktól és a nyelőktől 
különböző — csomóponton csak átáramlik; ami beérkezik, az távozik is. Ezeknél 
a csúcsoknál a folyamra teljesül az elektrodinamikából ismerős Kirchoff csomó- 
Ponti törvény megfelelője. Nézzük mindezeket pontosabban, azzal az egyszerűsítő 
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feltevéssel, hogy a hálózatban csak egy forrás és egy nyelő van! A forrást és a 
nyelőt hagyományosan s (source) és t (target, terminal) jelöli. 


Definíció (hálózat): Adort egy G — (V, E) irányítort gráf és ennek kér különböző 
pontja, s és t, melyeket forrásnak, illetve nyelőnek hívunk. Adott még egy az éleken 
értelmezett c : E a Rt pozitív értékű kapacitásfüggvény. A kényelem kedvéérr 
terjesszük ki c értelmezési tartományát: legyen efu,v) :— 0 minden usw € V., 
(u,v) € E esetén. Ekkor a (G, s,t,c) négyest hálózatnak nevezzük. 





Az anyag áramlását — a folyamot — úgy írhatjuk le, hogy a hálózat minden 
u, v csúcspárjára megmondjuk, mennyi az időegység alatt az (u, v) összekötteté- 
sen (vagy összeköttetéseken, ha több közvetlen kapcsolat is van u és v között) 
átmenő f (u, v) mennyiség. 








Definíció (folyam): 
következő feltételek: 
(1) minden u, v pontpárra f(u,v) — —f(v, u), 
(2) minden u € (s, tj pontra vev f(u,v) 7 0. 
(3) minden u, v pontpárra f(u,v) £ cíu, v). 
Ha f(u,v) — cíu,v), akkor az (u, v) párat telítettnek mondjuk (akár éle G-nek, 
akár nem). Az f folyam értéke, melyer 1f]-fel jelölünk, az s-ből kimenő összes 


folyam, azaz If — Dvev f(s.v)- 


Az (1) feltétel egy kényelmes és eléggé szemléletes technikai kikötés. Azt a 
tényt, hogy u-ból v-be f(u,v) mennyiséget juttatunk el, úgy is nézhetjük, hogy 
v-ből u-ba vittünk — f(u,v)-t. Az f(u,v) 5 0 eseménynek pedig azt a jelentést 
tulajdoníthatjuk, hogy (u, v) mentén f(u,v) mennyiségű anyag megy ki u-ból, 
míg f(u,v) c 0 azt jelenti, hogy — f(u, v) megy be u-ba. Erre is tekintettel a (2) 
követelmény a Kirchoff-törvény megfogalmazása. A (3) egyenlőtlenség fejezi ki, 
hogy az u-ból v be (közvetlenül, kerülő utak nélkül) átvitt mennyiség nem halad- 
hatja meg az (u, v) kapcsolat kapacitását. Az (1) és (3) alapján világos, hogy ha 
(u, v) és (v, u) egyike sem éle a hálózatnak, akkor f(u,v) — f(v, u) — 0. vagyis 
az ilyen párok között nincs érdemleges történés. Ebből és az (1) feltételből kö- 
vetkezik, hogy az f folyam megadásához elegendő azon f(u, v) értékek ismerete, 
melyekre u — vw éle G-nek, 

A következő rajz bal oldalán egy hálózat látható. Csak a pozitív kapacitású 
éleket tüntettük fel, a kapacitásukkal együtt. A jobboldali rajzon egy f folyam jel- 
lemző adatai is szerepelnek. Az éleken levő számok közül az első a kapacitás, a 
második a rajta átáramló mennyiség. A vi 5 t él kapacitása 2, a rajta átfolyó 
mennyiség pedig f(vi,t) — 0. A folyam értéke If! — 1, és például (vi, v2), va- 
lamint (t, vi) telített párok. A vi, vs csúcspár között két kapcsolat van, az egyik 


: V? GR függvényt folyamnak hívjuk, ha teljesülnek a 
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v1 — vsz, a másik vu; o vy. Ezeken most 0 folyam megy át. Az összképet ille- 
tően ugyanez lenne a helyzet, ha mindkét élen 1 egység áramlana keresztűl. Ek- 
kor is igaz lenne, hogy f(vi,vz) — f(v3,vi) — 0. Azt szeretnénk hangsúlyozni, 
hogy f(u, v) meghatározásához mindegyik u és v 
veni, 


ött menő élet figyelembe kell 








A maximális folyam problémája alapvető jelentőségű algoritmikus feladat 
mind az elméleti, mind a gyakorlati alkalmazások szempontjából. A probléma 
megfogalmazása és az első megoldás is L. R. Ford és D. R. Fulkerson (1957) 
nevéhez fűződik. 


A probléma: 
Adott egy (G, s,t, c) hálózat; találjunk hozzá egy maximális értékű f folyamot. 


A kérdés tehát az, hogy a hálózatot folyamatosan működtetve a forráspontból 
maximálisan mennyi anyag tud elindulni, illetve a nyelőpontba beérkezni egység- 
nyi idő alatt úgy, hogy a Kirchoff-törvényt és a kapacitások adta korlátokat meg- 
tartsuk. Természetesen a válaszunkban meg kell mondanunk a szállítás útvonalait 
is. Előre bocsátjuk, hogy a maximális folyamok értéke szükségképpen nemnega- 
tív. Minden hálózaton van ugyanis egy nulla értékű folyam, a nulta-folyam, amit 
az f(ujw) :5 0 egyenlőségekkel definiálhatunk (u, v € V). 

Ahhoz, hogy a megoldás közelébe jussunk, vagy egyáltalán, egy maximális 
folyam létezését igazolni tudjuk, érdemes a vágás fogalmát bevezetnünk. A kö- 
Vetkező szakaszban a kombinatorikában oly gyakran előforduló minimax tételek? 
egyikét bizonyítjuk, A tétel segítségével - amely folyamok és vágások között léte- 
sít kapcsolatot — ferakjuk a megoldás alapköveit. 





"Egy minimax tétel egy mennyiség maximumának és egy másik mennyiség minimumának az 
egyenlőségét mondja ki, 
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6.8.1. Kapcsolat a minimális vágással: a Ford-Fulkerson-tétel 


Definíció (s, t-vágás): Legyen (G, s.t,c) egy hálózat; A BCV, AUB-V 
és ANB — 8 (azaz A és B partícionálják V-t). Legyen továbbá s € At € B. 
Ekkor az A, B halmazpárt s, t-vágásnak, vagy röviden vágásnak hívjuk. Az A, B 
vágás kapacitásán a c( A, B) :—  EGEA4GEB c(u, v) mennyiséget értjük. Ha f egy 
folyam, akkor definiáljuk az A, B vágáson áthaladó folyamot. Ezt f(A, B)-vet 
jelölve: f(A, B) :— YrcaveB f(u,v). 





Figyeljük meg, hogy 1] — f(í5), VNIs5)). Tehát a folyam értéke az s-et vató- 
ban elhagyó folyam MEGALLAS jelenti. Ezt úgy ket érteni, hogy az 5-et elhagyó 
összes folyamból levonjuk az s-be visszatérő összes folyamot, hiszen azon v pon- 
tokra, melyekből s-be folyik pozitív mennyiségű folyam, f(s,v) negatív, így az 
összeget a megfelelő értékkel csökkenti. Ezzel összhangban az A, B vágáson át- 
haladó folyam azt fejezi ki, hogy mekkora mennyiségű anyag jut át rendszerünk A 
sPartjáról" a B-re. Nyilván ugyanannyi, mint amennyi s-ből elindul, mivel útköz- 
ben nem hagyunk ott sehol semmit. Ezt fejezi ki szabatosan a következő lemma: 






Lemma: Tetszőleges A, B s, t-vágásra és f folyamra IfI— f(A, B). 
Bizonyítás: Figyelembe véve, hogy B — V VA. az f(A, B) összeg így írható: 


HA B)Y- 3 fvz I fu JZ 7(wv)— 1710 [7]. 


UEAvEB UEA EV VEAVEA 


Mt S ucawey fluv) — If, mert ha u 5 s. akkor dev f(uv) — 0 a folyam 
definíciójának (2) feltétele miatt; u — s esetén pedig az összeg a folyam értékét 
adja. Az (1) feltétel szerint meg f(u,v)-k f(v,u) — 0, ezért I rea vea f(V) 7 
0.0 


Ezen a ponton láthatjuk, hogy a forrásnál keletkező anyag hiánytalanul eljut a 
nyelőhöz, ha a száll ját-módját a folyam-definícióban kikötöttek szerint vá- 
lasztjuk meg. Az előző lemma alkalmazható ugyanis az A — V V íÍt). B — íÍtj 
speciális esetre. Arra jutunk, hogy [f1 — f(V.4 ft). (th: a jobb oldalon éppen a 
t-ben elnyelődő mennyiség szerepel. 

Az A, B vágás c( A, B) kapacitása korlátot ad az A-ból B-be átvihető anyag 
ére. Szemléletesen azt várnánk, hogy s € A ést € B miatt a vágás 
korlátozza az IfI értéket is. Ez így is van: 











Állítás: Tetszőleges A, B s, t-vágásra és f folyamra If £ e(A, B). 
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Bizonyítás: 


V- 5 o fns I eu) —ef4 B) 


VEA EB UEAEB 


Az első egyenlőségnél a lemmát, az egyenlőtlenségnél pedig a folyam-definíció 
(3) feltételét használtuk, CI 


Tehát egy folyam értéke nem lehet nagyobb egy tetszőleges vágás kapacitásá- 
nál. A megígért minimax tétel így már sejthető: az egyenlőség el is érhető, azaz a 
maximális folyam értéke egyenlő a minimális vágáskapacitással, Hogy ezt bizo- 
nyítani tudjuk, szükségünk lesz néhány további fogalomra. 


A javító gráf 


Tegyük fel, hogy már eljutottunk valameddig egy nagy folyam tervezgetésében. 
Van egy f folyamunk, és az érdekel bennünket, hogy lehet-e javítani rajta, és ha 
igen, akkor hogyan. E célból nézzünk a folyam rajzára, és próbáljuk meg feltér- 
képezni a még kiaknázatlan lehetőségeket. Minden egyes (u, v) csúcspárra vizs- 
gáljuk meg, hogy mennyi anyagot tudnánk még átvinni közvetlenül u-ból v-be. 
A folyam-definíció (3) feltétele szerint az (u, v)-n átvihető mennyiség legfeljebb 
c(u,v), ezért a növelési lehetőség e kapcsolat mentén c(u, v) — f(u,v). Ezek a 
mennyiségek nem negatívak, hiszen f egy folyam; az f növelésére ott van esé- 
lyünk, ahol e(u, v) — f(u,v) 5 0. Ezek az észrevételek alapot nyújtanak a követ- 
kező fogalomhoz. 


Definíció (javító gráf): Adort egy (G — (V,E),s,t,c) hálózat, és rajta egy f 
folyam. Jelölje r(u,v) :z clu,v) — f(u,v) a maradék kapacitások függvényét. 
Az f folyamhoz tartozó javító gráf a Gy — (V, Ep) gráf az élein értelmezett r 
kapacitásfüggvénnyel, ahol Eg - ((u,v):r(u,w) 50k 





A következő ábra bal felén az előző példabeli hálózat és folyam szerepel. Mel- 
lette a folyamhoz tartozó G , javító gráf látható, az éleken a maradék kapacitá- 
Sokkal, Vegyük észre, hogy G-nek vannak olyan élei is, amelyek G-nek nem 
élei. Ilyen például a t — v3. Ennek jelenléte indokolt, minthogy c(t,vz) — 0. 
f(t,vz) — —1, amiből r(t, vs) — 1. 
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Az r függvény pozitív értékeket vesz fel a G , élein, így (G, s,t,r) egy há- 
lózat. Könnyen belátható, hogy egy f" : V2 G B függvény akkor és csak akkor 
folyam G ,-ben, ha f 4 f" folyam G-ben; ekkor pedig If 4 f1— 1714 II. Ha 
tehát találunk egy pozitív értékű f" folyamot G-ben, akkor f -- f" egy az f-nél 
nagyobb értékű folyam lesz az eredeti hálózatban. A folyam növelésének feladatát 
ezzel visszavezettük egy rokon kérdésre: pozitív értékű folyamot kell találnunk a 
(Gr, s.t,r) hálózatban. 

Hogyan keressünk ilyen folyamot? Tegyük fel. hogy G ,-ben találunk egy irá- 
nyított s s t utat, és az úton szereplő élek kapacitásainak minimuma d 2 0. Ez 
az út egy d értékű f" folyamot határoz meg G ,-ben: f" vegyen fel d-t az út élein, 
—d-t az út éleinek fordítottjain és nullát az összes többi páron. 





Definíció (növelő út, kritikus él: Legyen (G,s,t,c) hálózat, és f egy folyam 
rajta. A G ,-beli irányított $ -a t utakat növelő utaknak hívjuk. Egy növelő úton 
szereplő élek maradék kapacitásainak minimumát az úthoz tartozó kritikus kapa- 
cításnak, a megfelelő éleket pedig kritikus éleknek! nevezzük. 








Példánkban sv2vzvit növelő út, ami mentén eggyel növelhetjük a folyamot. 
Növelő út svovit is, ahol a (v2, vi) él menti növelés az eredeti gráfban a (vi, v2) 
él menti csökkentést jelenti (kevesebbet viszünk a rossz irányba). Mindkét növelő 
út kritikus kapacitása 1. Az első út kritikus élei v2 — vz és vz — vi, a másodiké 
pedig egyedül v2 — vi. 

Az eddigiekből kezd alakot ölteni egy algoritmus: a meglevő f folyamunkhoz 
készítsük el a G, javító gráfot, ebben keressünk növelő utat, e mentén növeljük 
meg a folyam értékét a kritikus kapacitással; azután ezt ismételjük. Kiindulásnak 
jó lesz a nulla-folyam. Kérdés, mi van akkor, ha már nincs G-ben növelő út. 
A következő tétel egyebek között azzal biztat bennünket, hogy ebben az esetben 
készen vagyunk, vagyis f már maximális. 





"A Aritikus él kifejezést - egészen más jelentéssel - már használtuk a PERT-módszer kapcsán. A 
két fogalom között nincs tartalmi kapcsolat. 
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Tétel (Ford-Fulkerson-tétel): Legyen f egy folyam a (G, s,t,c) hálózatban. A 
következő állítások egyenértékűek: 
(a) f egy maximális fértékű) folyam; 
(b) f-hez nem létezik növelő úi 
(e) létezik olyan A, B s,t-vágás, melyre c( A, B) — fi. 





Bizonyítás: 

(a) (b): Ha f-hez létezik növelő út a G , gráfban, akkor f értéke az előzőek sze- 
rint ennek az útnak a d 5 0 kritikus kapacitásával növelhető; ekkor f nem lehet 
maximális, mert van If] 3- d értékű folyam is. 
(b)(c): Tegyük fel, hogy nem létezik növelő út 7-hez. Legyen A azon pontok 
halmaza, amelyek G-ben s-ből irányított úton elérhetők, és legyen B :— V § A. 
Nyilvánvaló, hogy s € A, ést € B. Az A, B pár tehát egy s, t-vágás. Legyenek 
most u € A, v € B tetszőleges pontok. Az (u, v) pár nem éle G r-nek. Ez annyit 
tesz, hogy az (u, v) pár telített, vagyis c(íu, v) — f(u, v). Ezeket az egyenlőségeket 
összegezve az összes u € A, v € B párra azt kapjuk. hogy c(A, B) z f(A, B). A 
lemmából tudjuk, hogy f(A, B) — 1fl. amiből c( A, B) — If. 

(c) (a): Az állítás szerint If] £ c(A, B) igaz bármely f folyamra és A, B vá- 
gásra. Az [fi — e( A, B) egyenlőség ezért csak úgy lehetséges, hogy f egy maxi- 
mális folyam, A, B pedig egy minimális (kapacitású) vágás. C 





A következő ábra a Ford-Fulkerson-tételben felmerült helyzetet szemlélteti. 
A bal oldali rajzon a korábban már vizsgált hálózat egy f maximális folyamát 
mutatjuk. Látható, hogy Ifj — 3. Mellette a folyamhoz tartozó javító gráf található; 
ezen feltüntettük a bizonyításból adódó A, B vágást. A vágás A partját az s és v2 
csúcsok alkotják. Az eredeti hálózat rajzára pillantva meggyőződhetünk róla, hogy 
a vágás kapacitása c( A, B) — c(s, vi) e(v2, va) — 142 — 3. ami éppen a folyam 
értéke. 


B part, 


A part 
1 2 





A Ford-Fulkerson-tétel érdekes következménye, hogy egy folyam maximá- 
lis voltának van egyszerűen és gyorsan ellenőrizhető bizonyítványa. Képzeljük el. 
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hogy valaki mutat nekünk egy kusza hálózatot, rajta egy f folyammal, és azt ál- 
lítja, hogy f maximális. Hogyan győzhet meg bennünket erről egyszerűen? A tétet 
szerint elegendő egy olyan A, B vágást mutatnia, aminek a kapacitása éppen a fo- 
lyam értéke. Mivel If] és e( A, B) is gyorsan kiszámolható, egykettőre bizonyos- 
ságot szerezhetünk az állítás igazságáról. Az algoritmikus problémáknak azzal a 
tulajdonságával, hogy a válasznak van-e hatékonyan ellenőrizhető bizonyítványa, 
a 8. fejezetben foglalkozunk alaposabban. 





6.8.2. A Ford-Fulkerson-algoritmus 


A maximális folyam keresésére szolgáló Ford-Fulkerson-algoritmus lényegi lé- 
péseit tulajdonképpen már elmondtuk: folyamok fo, fi,...,fxk — f" sorozatát 
konstruáljuk meg sorban egymás után, Az fo az azonosan nulla folyam. Az fi; bir- 
tokában fi41-et úgy kapjuk, hogy az f; javító gráfjában keresünk egy javító utat: 
az út mentén a d; kritikus kapacitással növelve kapjuk az fi4.1 folyamot. Érvényes 
tehát az Ifigil — Il 4 di összefüggés. Akkor állunk meg, amikor a folyamhoz 
már nem létezik növelő út, A Ford-Fulkerson-tételből következik, hogy ekkor egy 
maximális folyamunk van, 





Feladat: Mutassuk meg, hogy ha a hálózat éllistával adott, akkor a növelő lépés, 
vagyis fi-ből fi4-1 számítása 0(e) elemi művelettel kivitelezhető, ahol e a G éle- 
inek száma. (Feltehető, hogy G összefüggő. A Gr, javító gráfnak legfeljebb csak 
2e éle lehet, így a hálózat és f; ismeretében 0(e) költséggel megépíthető. Javító 
utat ezután a Gy, gráf s-ből rajtoló szélességi bejárásával kaphatunk.) 





Mit mondhatunk a növelő lépések számáról? Ha az élkapacítások egészek, ak- 
kor legfeljebb If") számú növelés után készen vagyunk (7" egy maximális folya- 
mot jelöl), ugyanis ekkor a d; kritikus kapacitások pozitív egészek lesznek, Rög- 
zítsük ennek a fejtegetésnek egy fontos következményét; 


Következmény: Legyen (G,s,t,c) egy hálózat, és tegyük fel, hogy a celu, v) ka- 
pacítások mind egész számok. Ekkor van olyan f" maximális folyam, hogy az 
f"(u,v) értékek egészek (u,w E V)]. Ebből adódóan a maximális folyam értéke 
ís egész. 






Bizonyítás: A Ford-Fulkerson-algoritmus működéséből látható, hogy az fi(u.v) 
értékek egészek lesznek, Ez nyilvánvaló a nulla-folyamra. Utána pedíg használ- 
hatjuk, hogy az fisi(u, v) — fi(u, v) különbség a 0, id; egészek valamelyike. D 


Ha tehát a kapacitások egészek, akkor legfeljebb [/"] növeléssel eljutunk egy 
maximális folyamig. Ez egyfelől megnyugtató, hiszen látjuk, hogy véges sok lépés 
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elég. Másfelől a növelések száma ettől még égbekiáltóan nagy is lehet, amint azt 
az alábbi hálózat mutatja. 





Ha ebben a hálózatban felváltva mindíg az svrvat és az svovit növelő utak 
mentén javítunk (a kritikus kapacitás 1 lesz), akkor a nulla-folyamból 2191 javí. 
tás után kapunk maximális folyamot. Ugyanakkor két javító menet is elég lenne: 
először az svit, majd az svot út mentén. 

Ha az élkapacitások racionális számok, akkor a közös nevezőjükkel való szor- 
zás után egész kapacitásaink lesznek, Így ebben az esetben is véges sok (noha 
esetleg nagyon sok) növelő lépést hajtunk végre. 

Ha irracionális kapacitásokat is megengedünk, akkor előfordulhat, hogy a ja- 
vító utak balszerencsés választása miatt az eljárás nem ér véget véges sok lépésben. 
Sőt, még az is megeshet, hogy az I] értékek a maximális folyamokénál kisebb ér- 
tékhez konvergálnak. 

Mindezekből nyilvánvaló, hogy nagyon nem mindegy. miként választunk nö- 
velő utat. A találomra való választással racionális kapacitások esetén ugyan egy 
működő, ámde lassú algoritmust kapunk, irracionális kapacitásokkal pedíg a mód- 
szer nem is működik. 


6.8.3. . Edmonds-Karp és Dinic algoritmusai 


J. Edmonds és R. M. Karp (1972) nagyon egyszerűen hangzó receptet javasolt 
az előző szakaszban említett bajok orvoslására. Módszerük rokonszenves vonása, 
hogy a javító menetek számára csak n-től és e-től (azaz csupán a hálózat pontjainak 
És éleinek számától) függő korlát adható. Javaslatuk a Ford-Fulkerson-módszer 
Pontosítása, amennyiben arról rendelkezik, hogy miként válasszunk növelő utat az 
adott f folyamhoz: 


EDMONDS-KARP-HEURISZTIKA : A folyam növelésére mindig a legrövi- 
debb — vagyis a legkevesebb élből álló — növelő utak egyikét válasszuk. 


Edmonds és Karp ötletéről nem látszik elsőre, hogy miért olyan jó. Az minden- 
€setre biztató, hogy az előző rajz hálózatában a nulla-folyamból kiindulva két me- 
Netben eljut a maximálisig. 
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A gondosabb elemzéshez tegyük fel, hogy adott a (G, s, t, c) hálózat és rajta 
egy f folyam. Tekintsük a G ; javító gráfot; legyen benne r egy legrövidebb növelő 
út. Ennek hosszát (élszámát) jelöltje . Osszuk rétegekre a Gr csúcsait az 8-től 
való távolság szerint. Az s-ből egyetlen irányított éllel elérhető csúcsok alkotják 
az első réteget, és ft az 1-edik rétegbe kerül. Ezt a beosztást kapjuk, ha s-től indulva 
szélességi bejárással végigmegyünk az s-ből irányított úton elérhető v csúcsokon, 
és közben számítjuk a Dív) értékeket (tásd a 6.5. szakaszt). Világos, hogy a v és w 
csúcsok pont akkor vannak egy rétegben, ha Dív] — Dlwl]. Kiemeljük a felosztás 
két fontos tulajdonságát: 

(1) Egy él legfeljebb egy réteggel mehet előre. 

Ez nyilvánvaló, hiszen az s-től í távolságra levő pontból kiinduló él végpont- 
jának a távolsága nem lehet több, mint í -- 1. A Gy egy z — y élét nevezzük 
vastagnak, ha Dly] — D(z] -- 1. Az (1) tény hasznos folyománya a következő: 
(2) Az! hosszúságú s -a t utak csupa vastag élből állnak. és nincs 1-nél rövidebb 
satút 

Nézzük most, miként módosul a kép, ha m mentén növeljük f-et a kritikus 
kapacitással. Hogyan kapható meg az új f" folyam Gr javító gráfja G r-ből? A mr 
út legalább egy éle — nevezetesen egy kritikus él — telített lesz, így eltűnik a javító 
gráfból. Ezenkívül legfeljebb / darab új él jelenik meg a G-ben (rr élei ellenkező 
irányítással, ha eddig még nem szerepeltek), de ezek az új élek mind visszafelé, 
alacsonyabb sorszámú rétegbe mennek. Arra jutunk innen, hogy (1) és (2) a Gf- 
re vonatkozóan is igaz marad (noha esetleg a rétegezés már nem tükrözi hűen a 
távolságokat). Ebből viszont azonnal látszik, hogy a következő növelő út sem lehet 
rövidebb 1-nél. 

Nézzük meg. hogy hányszor adódhat egymás után ( hosszú növelő út. Ha van 
ilyen G-ben, akkor a növelés utáni javító gráfban eggyel kevesebb vastag él lesz 
(legalább egy kritikus él törlődik), és az (1), (2) tények is érvényben maradnak, 
mert a növelés eredményeként csak visszafelé mutató élek keletkezhetnek. 

A (2) tulajdonság öröklődése miatt addig lesz ! élből álló növelő út, amíg ma- 
rad vastag élekből álló s -— t út. A vastag élek viszont minden növelésnél fogynak. 
Így legfeljebb e ilyen növelés lehetséges. Érvényes tehát a következő: 











Tétel: Az Edmonds-Karp-heurisztika szerinti növelésnél a növelő utak hosszat 
nem csökkenő sorozatot alkotnak. Ebben a sorozatban egy adott úthosszúság leg- 
feljebb e-szer fordulhat elő. Következésképpen legfeljebb efn — 1) növelés tehet- 
séges. A heurisztika alkalmazásával O(eén) elemi lépésben kapunk maximális fo- 
tyamot. 


Bizonyítás: Az első két állítást már beláttuk. A harmadik — a növelések számáról 
szóló — azonnal következik ezekből, hiszen a növelő utak egyszerű utak. A lehet- 
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séges hosszúságaik ezért 1, 2, . . . n — 2,n — 1, és bármely hosszúság legfeljebb 
e-szer léphet fel 

Az utolsó é oz elég igazolni, hogy egy növelés O(e) időben elvégezhető. 
A növelés költségéről korábban mondottakhoz csak annyit kell hozzátenni, hogy a 
javító gráfban az s-ből indított szélességi bejárásnál a faéleket követve éppen egy 
legrövidebb s-ot utat kapunk. 








A bizonyítást jobban szemügyre véve kiderül, hogy f javításakor az ( hosszú 
növelő utak élei mind vastag élek G ,-ben. Az összes ilyen javítás műveletigényére 
0(e?) korlátot kaptunk (legfeljebb e növelés darabonként 0(e) költséggek). Ki- 
használva, hogy a vastag élekből álló gráf egy DAG, ezek a növelések gyorsabban 
is elvégezhetők. De nézzük pontosabban, mi is a cél: 


Legyen (H, s, t,r) éllistával adott hálózat, ahot H egy DAG., és r az élein ér- 
telmezett kapacításfiiggvény. Olyan g folyamot — ún. blokkoló folyamot keresünk, 
amelyhez minden s -o t irányított úton van telített él. 


Feladat: Igazoljuk, hogy egy maximális folyam egyben blokkoló folyam is. Mu- 
tassuk meg, hogy a megfordítás nem igaz: adjunk példát blokkoló folyamra, ami 
nem maximális. 


Ha találunk egy g blokkoló folyamot a G vastag éleiből álló H gráfban, akkor 
f tg már biztosan nem növelhető a vastag élek mentén, azaz minden további 
növelés csak 1-nél hosszabb úton lehetséges. 


Dinic módszere DAG-beli blokkoló folyam keresésére 


Tegyük fel, hogy a H DAG-nak n csúcsa és m éle van. E. A. Dinic (1970) algorit- 
musa a nulla-folyamból indulva szerkeszt egy g blokkoló folyamot. Az algoritmus 
történései három csoportba sorolhatók; ezek a nyomulás, a növelés és a takarítás. 

Nyomutlás során egy s-ből induló r irányított utat építünk. Amíg csak lehet- 
séges, a-t az utolsó pontjából induló valamelyik él végpontjával bővítjük. Akkor 
állunk meg a nyomulással, amikor vagy t-be értünk, vagy már nem tudunk tovább 
menni, mert nem vezet ki él a x utolsó pontjából. Mivel H egy DAG, a x sosem 
állhat több, mint n csúcsból. Ebből következően egy nyomulás O(n) költséggel 
megvalósítható. 

Növelésre akkor kerül sor, ha a nyomulással t£-be értünk. Ez esetben x egy 
növelő út. Az aktuális g folyamot x mentén növeljük a d, kritikus kapacitással. 
Ezután az út éleinek kapaci t d-vel csökkentjük. töröljük a kritikus éleket 
(amelyek kapacitása nullára változott). Egy növelés műveletigénye arányos a x 
hosszával, vagyis O(n)-nel becsülhető. 
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Ha a nyomulással egy r / t csúcsnál akadunk el (azaz nem tudunk tovább 
menni), akkor takarítás következik. Ez azt jelenti, hogy töröljük H-ból az r-be 
menő éleket. Egy takarítás a törölt élek számával arányos lépésszámban véghezvi- 
hető. 

A takarítás és a növelés végeztével (s-ből induló) nyomulásba kezdünk. A 
munka akkor fejeződik be, amikor már nincs s-ből kimenő él. 





Tétel: Dinic módszerével W O(mn) művelettel kapunk blokkoló folyamot a. H 
DAG-ban. 


Bizonyítás: A módszer helyessége nyilvánvaló: amikor ugyanis egy élet törlünk, 
akkor rajta keresztül már nem vezethet az aktuális g-t növelő út. Így a munka vé- 
geztével nem létezik csupa H-beli élekből álló növelő út. Úgy is fogalmazhatunk, 
hogy minden s -— t irányított úton van telített él, tehát a végső g egy blokkoló 
folyam H-ban. 

Ami a költségeket illeti, vegyük észre, hogy a takarítások és a növelések 
száma együttesen sem lehet több m-nél, mivel ezek élek törlésével járnak. A ta- 
karítások összköltsége O(m), ugyanis ezek során legfeljebb m élet törölhetünk; 
a növeléseké pedig O(mn). Nézzük most a nyomulásokat: a legutolsó kivételé- 
vel minden nyomulást növelés vagy takarítás követ, így legfeljebb m 4 1 nyo- 
mulás lehetséges. Ezék együttes lépésszáma ezért 0(mn). Mindent számba véve 
O(m) 4 O(mn) - O0(mn) — O(mn) lépés elegendő. D 





Ha az Edmonds-Karp-heurisztika helyett Dinic módszerét alkalmazzuk az f 
folyam növelésére, akkor legfeljebb n — 1 ilyen növelésre lesz szükség. Az előző 
tétel alapján egy növelés költsége O(en), mert a vastag élekből álló gráfnak legfel- 
jebb e éle lehet. A Dínic-algorítmussal tehát O(en?) lépésben kapunk maximális 
folyamot. 





Megjegyezzük, hogy DAG-beli blokkoló folyam keresésére van 0(n?) lé- 
pésszámú módszer is, amivel O(n?) költséggel adódik maximális folyam. Az első 
ilyen módszert A. V. Karzanov találta 1974-ben, A folyamalgoritmusoktól búcsú- 
zóban megemlítjük, hogy a legjobb ismert módszerek költsége O(en log(n?/e)) 
(A. V. Goldberg, R. E. Tarjan, 1986) és Ofen), ha e 5. n5/84€ (N, Alon. 
J. Cheriyan, T. Hagerup, 1990). Érdekes nyitott kérdés, hogy létezik-e minden há- 
lózaton O(en) lépésszámban célt érő folyamalgorítmus. 








alójában Dinic módszerének egyszerűsített változatát ismertettük. Pétdául takarítás után nem 
kell feltétlenül s-től kezdeni a nyomulást. Jobban járunk. ha csak a m út z előtti pontjáig megyünk 
vissza, és onnan nyomulunk előre, 
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6.8.4. . Alkalmazások 


Három példával szeretnénk érzékeltetni a folyamok széleskörű és sokszínű alkal- 
mazási lehetőségeit. Hogy egyszerűsítsünk a dolgokon, olyan hálózatokra szorít- 
kozunk, amelyekben bármely u, v pontpár között legfeljebb csak az egyik irányba 
megy él. Ezáltal av — w élen átfolyó mennyiséget azonosíthatjuk az f(v, w) 
értékkel. Így persze az is feltehető, hogy ha v —G w éle a hálózatnak, akkor 
J(v,w) 2 0. Amikor pedig egy g folyamot adunk meg, akkor elég a gív, w) 
értékeket leírni, ahol v 5 w € E. 

Példáink kapcsán az olvasó könnyen meggyőződhet róla, hogy a javasolt egy- 
szerűsítés nem jelenti az általánosság csorbítását. Ha ugyanis u — v és v G u ís 
éle a hálózatnak, akkor utóbbit helyettesíthetjük egy v — v" — u élpárral, ahol 
vt egy új csúcs. A v — v" és av! — u élekre ugyanazt (pl, kapacitást) írjuk, mint 
ami a v — u élen szerepel. 





Élidegen utak irányított gráfokban 


Legyen G egy irányított gráf, s és t két csúcsa. Szeretnénk minél több G-beli s-ot 
irányított utat találni azzal a feltétellel, hogy bármely két út élidegen (másként 
mondva: közös él nélküli) legyen. 

Nézzük evégből a (G , s, t, c) hálózatot, ahol a G minden (u, v) élének a c(u, v) 
kapacitása 1. A kapacitások egészek, tehát van olyan f maximális folyam, amelyre 
az f(u, v) értékek egészek minden u,v € V csúcspárra. Ebből azonnal követke- 
Zik, hogy ha u — v € E, akkor f(u, v) vagy 0 vagy 1. Tegyük fel, hogy a folyam 
értéke k. Megmutatjuk, hogy ekkor van G-ben k darab páronként élidegen $ 5 t 
út. Ennek első lépéseként ajánljuk a következő feladatot: 


Feladat: Mutassuk meg, hogy ha k 5 0, akkor van olyan zr út 5-ből t-be, amelynek 
az élein f 1-et vesz fel. (Induljunk el s-ből egy olyan u 2 v € E élen, amelyre 
f(uw) — 1. A v-be érve töröljük ezt az élet, majd lépjünk tovább egy olyan 
9 5 w élen, melyre f(v,w) — Il, és töröljük ezt az élet is, Így folytatva sosem 
akadhatunk el egy z A t csúcsban; r-ből ugyanis legalább annyi 1-es indul ki, 
mint amennyi befut oda. Előbb-utóbb 1-be érünk, mert az élek fogynak.) 


Ha tehát k 5 0, akkor nézzünk egy a feladat szerinti a utat. Töröljük G-ből a z 
éleit, és feledkezzünk meg a rajtuk átmenő egységnyi folyamról. A kapott gráfban 
egy k — 1 értékű folyam marad, amire k— 1 5 0 esetén ismételjük az előző 
űtkeresést, Így folytatva k darab élidegen irányított s -— € utat kapunk. 

Fordítva, ha 1, 72, . . . , Tk páronként élidegen irányított s az £ utak G-ben, 
akkor ezek mindegyikén egységnyi folyamot küldhetünk a forrásból a nyelőbe. 
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ami összesen egy k értékű folyamot jelent. A maximális folyam értéke tehát meg- 
egyezik a legnagyobb élidegen s - t utakból álló rendszer elemszámával. 

Az eddigiek egy 0(en?) költségű algoritmust sugallnak egy ilyen útrendszer 
megtalálására: először kiszámítunk egy f egész értékkészletű maximális folyamot, 
majd ebből összerakunk egy maximális útrendszert. A költségek közül a domináns 
rész a Dinic-módszer lépésszáma, amivel az f folyamot számítjuk. 


Feladat: Mutassuk meg, hogy f ismeretében O(e) lépésben kaphatunk k darab 
páronként élidegen s -— t utat. (Lásd az előző feladathoz mellékelt ötletet.) 


Mielőtt továbbmennénk, lássuk, mit mond esetünkben a Ford-Fulkerson-tétel. 
A tétel szerint van egy A, B vágás, aminek a c( A, B) kapacitása éppen az útjaink 
k száma. Más szóval A-ból B-be k irányított él megy. Ez a k él lefogja az összes 
§ "a t utat abban az értelemben, hogy minden ilyen út tartalmaz A-ból B-be menő 
élet (mert $ € A ést € B). Ezzel egyrészt egy másik bizonyítást kaptunk arra, 
hogy k-nál több páronként élidegen út nem létezhet. Másfelől lényegében igazol- 
tuk K. Menger nevezetes gráfelméleti tételét, amely szerint a G-beli páronként 
élidegen 8 a t utak maximális száma megegyezik az s -a t utakat lefogó élek 
minimális számával. 

Itt marímum £ minimum nyilvánvaló, mert egy lefogó élrendszer az út- 
jaink mindegyikéből tartalmaz élet. Másfelől az előbb kiderült, hogy van olyan 
Páronként élidegen s u t utakból álló rendszer, ami éppen annyi útból áll, mint 
egy lefogó élhalmaz (utóbbi az A-ból B-be menő élek összessége). Innen pedig 
már adódik a marimum 2 minimum egyenlőtlenség. 








Maximális párosítás páros gráfokban 


Egyszerű megfogalmazása ellenére ... máig is talán 
ez az egész párosításelmétet kulcseredménye. 
Lovász LÁSZLÓ, MICHAEL D. PLUMMER!? 





Egy olyan problémát fogalmazunk meg a folyamok nyelvén, amivel már találkoz- 
tunk: a maximális párosítás keresését páros gráfokban. Ezt elsősorban a megfelel- 
tetés egyszerűsége és elméleti érdekessége miatt tesszük, és nem azért, mert gyors 
algoritmust remélünk belőle. A folyamalgoritmusokra épülő megoldások nem tud- 
nak versenyezni a párosítási feladat sajátosságaira kihegyezett közvetlen módsze- 
rekkel, így a magyar módszerrel sem. 

















SEzzel a mékatássai vezetik fel König Dénes mini. 
kozó nagymonográtiájuk (Matching Theory, Akadémi. 


tételét a párosítások elméletével foglal- 
Kiadó, Budapest, 1986) 4. oldalán. 
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Legyen G — (11, V2; E) egy páros gráf, amiben maximális párosítást kere- 
sünk. Készítsünk belőle hálózatot az alábbiak szerint: először is irányítsuk az F- 
beli éleket V1-től V2 felé; ezek kapacitása legyen [Vi] -r 1. Vegyünk fel még a 
meglevő pontokon kívül egy s forrás egy t nyelőt. Az s-ből vezessünk 1 ka- 
pacitású éleket a Vi pontjaiba, és indítsunk ugyancsak ! kapacitású éleket a V3 
pontjaiból t-be. 

Megmutatjuk, hogy az így kapott hálózatban a maximális folvamok értéke 
megegyezik a G-beli maximális párosítások méretével, Legyen f egy csupa egész 
értékű maximális folyam, és legyen [/f] — k. A V4 pontjaiba legfeljebb egységnyi 
folyam folyhat be, ezért egy u € Vi ponthoz legfeljebb egy olyan (u,v) e E él 
illeszkedhet, amelyre f(u,v) — 1. A többi ilyen élen f nullát vesz fel, Hasonló ér- 
vényes a V2 pontjaira. Ezek szerint azok az (u, v) € E élek, melyekre f(u,v) 51, 
egy párosítást alkotnak G-ben. A rajtuk átmenő összes folyam egyrészt megegye- 
zik az élek számával, Másrészt a lemma szerint k-val is, hiszen ez a mennyiség az 
(s UV, (tj) U V2 vágáson átáramló f((s) u VI, (t) U V2) folyam. Van tehát a 
G-ben k élből álló párosítás. 

Fordítva, ha az (u, 1), (u2, v2),... (u, Ur) € E élek egy párosítást alkot- 
nak (u; € VI, v; E V2), akkor az $ — u; — v; — t utak mindegyikén egységnyi 
folyamot vihetünk a hálózatunkban s-ből t-be; ezek összesen egy k értékű folya- 
mot adnak. A maximális folyamok értéke tényleg egyenlő a maximális párosítások 
élszámával. 





í 






Prábáljuk meg ítt is értelmezni a Ford--Fulkerson-tétel állítását, ahogy azt az 
élidegen utaknál tettük! A tétel alapján létezik egy A, B s, t-vágás, amelynek a 
k kapacitása éppen a maximális folyamok értéke, vagyis a maximális párosítások 
élszáma. Legyenek 21, 22, . . . , rt a Vt azon pontjai, amelyek nincsenek A-ban, és 
legyenek yi, 42, . . . , Wm az A halmaz V5-beli pontjai. Az A-ból B-be menő élek 
között nem lehet olyan, ami V1-ből V2-be mutat, mert egy ilyen él kapacitása túl 
nagy: [41-61 5 k. Ebből arra következtethetünk, hogy az E-beli élek mindegyike 
illeszkedik az x; vagy az yj pontok valamelyikéhez. Az x; és az y; pontok ebben 
az értelemben egy a G éleit lefogó ponthalmazt alkotnak. Mekkora ez a halmaz? 
Az A-ból B-be menő élek éppen az s — ax; és az yj — t élek, Ezek kapacitása 1, 
ami azt jelenti, hogy a számuk éppen a vágás kapacitása, k. Van tehát a G-ben a 
Maximális párosítások élszámával egyező méretű lefogó ponthalmaz. 

Ezzel a birtokunkba jutott a gráfelmélet egyik tündöklő ékköve, König Dénes 
Minimax tétele, amely így hangzik: egy G páros gráf maximális párosításainak a 
mérete megegyezik a G éleit lefogó ponthalmazok minimális elemszámával, 

A mazrimum £ minimum egyenlőtlenség itt is nyilvánvaló: egy k élű páro- 
sítás éleit nem lehet k-nál kevesebb ponttal lefogni. Az előző okfejtés adja a jóval 
tartakmasabb marimum 2 minimum egyenlőtlenséget, 
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Feladat: A bevezető fejezetben a lovagok és udvarhölgyek problémájáról megem- 
lítettük, hogy pontosan akkor mirrcs megoldása, ha a megfelelő gráfban van König- 
akadály. Bizonyítsuk be ezt az állítást. (Alkalmazzuk König minimax tételét.) 


Hálózatok alsó korlátokkal 


A hálózatfogalom, amivel eleddig foglalkoztunk, meglehetősen egyszerűnek 
mondható. Gyakran előfordul, hogy az alkalmazások követelményei ennél fino- 
mabb, több tényezőre is érzékeny modelleket kívánnak meg. Most - rövid ízelítő 
gyanánt - egy ilyen árnyaltabb hálózat folyamairól ejtünk pár szót. 

Tegyük fel, hogy a c(u,v) kapacitások mellett — amelyek felülről korlátoz- 
zák az u-ból közvetlenül v-be áramló folyamot — alsó korlátjaink is vannak az 
f(u,v) mennyiségekre. Az ilyen hálózatokat formálisan egy (G, s,t,c,k) alakú 
ötössel írhatjuk le. Ebben az első négy összetevő értelmezése a régi. A k a G élein 
értelmezett, nemnegatív értékű függvény, ami az élekhez rendelt alsó korlátokat 
mondja meg. A korábbi folyam-definíció kiegészítéseként megköveteljük, hogy 
k(u,v) £ fiu v) is teljesüljön a G minden u — v élére. 

Az egyszerűbb modellnél a folyamok létezése felettébb jámbor kérdésnek bi- 
zonyult; a nulla-folyam minden hálózaton eleget tett a definíciónak, Az új modell- 
hez nyilvánvalóan nincs ilyen univerzális választás. 

Most megmutatjuk, hogy (régi értelemben vett) maximális folyamok segítségé- 
vel hatékonyan eldönthető, hogy egy H — (G, s,t,c, k) alakú hálózathoz létezik-e 
Jolyam, 


Evégből egy alsó korlátok nélküli HM" hálózatot készítünk. Kényelmi okokból 
tegyük fel, hogy G-ben nincs s — tést — s él. Vegyünk fel a G — (V, E) 
pontjai mellé egy új forrást és egy új nyelőt; legyenek ezek § és T. A H/ há- 
lózat ponthalmaza V U (ST) lesz. A G éleit megtartjuk, de új kapacitásokat 
rendelünk hozzájuk. Az (u,v) e E él c(u, v) kapacitása a H! hálózatban legyen 
d(uv) :— cíu, w) — kí, v). (Nyilván feltehetjük, hogy e(u,v) 2 0: ellenkező 
esetben nem létezhet folyam az eredeti hálózatban, mivel már az u — v élre kirótt 
feltételek sem teljesíthetők.) Adjunk még a H"-höz egy S — vésegy v 5 T élet 
minden v € V-re. Az S — vél kapacitása legyen c(S,v) — Eiues kit v). 
vagyis a v-be érkező G-teli élek alsó korlátjainak az összege. Hasonlóan, legyen 
ev. D)- Divwes Ftv; w), a v-ből kimenő G-beli élek korlátjainak az összege. 
Végül csapjunk még a hálózathoz egy co kapacitású t — s élet. 

A következő rajzon az átalakítást szemléltetjük. A baloldali gráf éleire írtuk az 
alsó korlátokat és a kapacitásokat. Így például k(s,v) — 1 és e(v,t) — 3. Mellette 
a megfelelő H" hálózat szerepel; az éleken a c" kapacitásokat tüntettük fel. 
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8 2.3 
s (d t 








Tétel: A H — (G,s,t,c,k) hálózatban akkor és csak akkor létezik folyam, ha a 
H" hálózat (5-ből T-be menő) maximális folyamának az értéke Ua. mez kí, v). 


Megjegyezzük, hogy a M/-re vonatkozó állítás egyenértékű azzal, hogy egy 
maximális folyamra nézve az $ — vésav — T élek mind telítettek. Az (5), 
VuU(T)ésav Ut5), (7) vágások kapacitása ugyanis éppen EluwjeB k(u,v). 


Bizonyítás: Tegyük fel először, hogy van egy f folyamunk M"-ben, aminek az 
értéke SEK cz k(u, v). Ebből egy g folyamot konstruálunk M-ban, A G gráf 
minden Úr) élére végezzük el a következőket: vonjunk le k(u, v)-t f(5, v)-ből 
és f(u, T)-ből és adjunk ugyanennyit f(u, v)-hez. 

A módosítások során megtartottuk a Kirchoff-törvényt a G csúcsaiban (az át- 
menő folyamból ugyanannyit vontunk le, mint amennyit hozzáadtunk). A módo- 
sítások után az 5-hez és T-hez illeszkedő éleken áramló mennyiség 0, így eze- 
ket figyelmen kívül hagyhatjuk. Ha még a (t, s) élről és a rajta átmenő folyam- 
ról is elfeledkezünk, akkor azt kapjuk, hogy a G élein értelmezett g(u,v) :— 
f(u,v) 4 k(u,v) függvény s és t kivételével mindenütt eleget tesz a Kirchoff- 
törvénynek. Legyen most u — vegy éle G-nek. A 


0 £ f(uv) £ dluw) z eluv) — klu,v) 


egyenlőtlenségekből látjuk, hogy kíu.v) c fluw) 4 k(íu,v) c clu,vw). Kt a 
középen álló mennyiség nem más, mint g(u,v). Tehát g tényleg egy folyam a 
H :- (G, s, t, c, k) hálózatban. 

A megfordítást úgy bizonyítjuk, hogy egy 9(-beli g folyamból egy alkal- 
mas f-et konstruálunk. Ezt lényegében az előző eljárás fordítottjával tehetjük 
meg. Először egy f" függvényt definiálunk a X" élein. Legyen f"(t,s) — lg]. 
f(uv) — gíuw) hhu a ve Eés f(Sv) — f(v.T) - 0. hav € V. Az 
így kapott f" a V U (5, T) minden pontjában betartja a Kirchoff-törvényt. Ezután 
módosítjuk f/-t. Egymás után véve az (u, v) € E éleket adjunk k(u, v)-t f"(S, v)- 
hez és ff(u, T)-hez, és vonjunk le k(u,v)-t az f"(u, v)-ből. Az előzőek mintájára 
könnyű megmutatni, hogy az eredményül kapott f egy maximális folyam a MH" há- 
lózatban, amelyre If - uveg kí, v). Ennek a részleteit az olvasóra hagyjuk. 
ii 
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A tételből következik, hogy folyamalgoritmus alkalmazásával 0(en?) lépés- 
ben eldönthető, hogy van-e folyam a (G, s,t, e, k) hálózatban (n a G pontjainak, 
€ pedig az éleinek a száma). 


Feladat: Tegyük fel, hogy a H" konstrukciójában a t — s élhez oo helyett egy 
d 5 0 kapacitást rendelünk. Mutassuk meg. hogy az így módosított H"-höz ponto- 
san akkor létezik ElueE k(u, v) értékű maximális folyam, ha H-ban van olyan 
4 folyam, amelyre Ig] € d. 


Feladat: Tegyük fel, hogy a H — (G, s, t,c,k) hálózathoz tartozó kapacitások és 
alsó kortátok mind egészek, Legyen d € Z. Igazoljuk, hogy ha a H-hoz van olyan 
9 folyam, amelyre Ig] £ d, akkor olyan g" folyam is van, amelyre Ig") £ d szin- 
tén teljesül, és ezenfelül a g"(u, v) számok mind egészek. (A H, d párhoz tartozó 
HW" hálózat kapacitásai mind egészek. Ennek egy egész értékkészletű maximális 
folyamából a tételbeli eljárást követve kaphatunk egész értékkésztetű g"-ot.) 


Egy ütemezési feladat 


Zárópéldaként egy ütemezési feladatot körvonalazunk, amihez — talán kissé 
váratlanul — egy alsó korlátokkal rendelkező hálózat ad megoldást. Tegyük fel, 
hogy egy légitársaság a Ji, Ja. . . . , Jn járatokat szeretné üzemeltetni, és d da- 
rab azonos típusú (mondhatni: csereszabatos) repülőgépe van erre a célra. Minden 
Ji J; járatpárra ismert, hogy van-e elég idő arra, hogy a J; teljesítése után egy gép 
felkészüljön a J; repülésére, Ha J;, J;-re a válasz igenlő, akkor azt mondjuk, hogy 
J; követheti JiA. 

A követhetőségi viszonyok - melyek egy irányított gráfot jelentenek a járatok 
halmazán — ismeretében szeretnénk eldönteni, hogy megvalósíthatók-e a járatok 
legfeljebb d repülőgéppel. 

Egy olyan hálózatot készítünk, amelyben a J; légijáratnak két csúcs, i és €, 
valamint az í — 1! él felel meg (1 £ i £ m). Ha J; követheti J;-t, akkor vezessünk 
irányított élet 7 -ből j-be. Vegyünk még fel egy s forrást és egy t nyelőt, és adjuk a 
hálózathoz az s — i ési — t éleket (1 £ i £ m). Az összes él kapacitása legyen 
1. Azíi — f alakú élek alsó korlátja legyen 1, a többi élé pedig 0. 














ÁMítás: A Ji. Ja, ..., dm járatok akkor és csak akkor teljesíthetők legfeljebb d 
géppel, ha a hálózathoz van olyan g folvam, amelyre Ig] £ d. 


Bizonyítás: Tegyük fel először, hogy létezik egy g folyam a hálózaton, amelyre 
Ig] £ d. Az előző feladat alapján feltehető, hogy g minden élen egész számot vesz 
fel. Ebből a kapacitások és a korlátok figyelembe vételével adódik, hogy g(u, v) € 
10,1) minden u — v irányított élre. Vegyük szemügyre azt a részgráfot, aminek 
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az élei az egységnyi folyamot szállító élek. Ez — az élidegén utaknál látott módon — 
felbontható legfeljebb d darab 





(b 80 io io ipa a sah agat 
út egyesítésére. Két ilyen útnak s és t kivételével nincs közös pontja. A (t) út 
létezése azt jelenti, hogy a Jp, Ji... Ju járatok egy géppel teljesíthetők. A 
k(i, 7) — 1 feltételek miatt minden (i, í") él szerepel valamelyik ilyen úton. Tehát 
legfeljebb d géppel tényleg minden járat lebonyolítható. 

Fordítva, tegyük fel, hogy van egy legfeljebb d gépet használó, minden járatot 
k. Nézzük ebben egy gép egymás utáni feladatait. Ha ezek a 
diss Jin. J;, járatok (ebben a sorrendben), akkor a (1) út éleit a hálózat tartal- 
mazza, Ezen az úton egységnyi folyamot küldhetünk s-ből t-be. Ezt minden gépre 
elvégezve egy legfeljebb d értékű g folyamot kapunk. A kapacitásfeltételek telje- 
sülnek, mert az így kapott (1) utaknak s és t kivételével nincs közös élük, hiszen 
egy járat egy géphez tartozik. Az (í, 1) élekre kiszabott g(i,i") 2 1 feltételeket is 
megtartjuk, mert az ütemezésben minden járatnak van gazdája. Megállapíthatjuk 
immár, hogy g eleget tesz a követelményeknek, D 





Feladat; Mutassuk meg, hogy a követhetőségek gráfjának és d-nek az ismeretében 
0(m$9) lépésben eldönthető, hogy van-e a Ji, Ja, . . . , Jn járatoknak legfeljebb d 
géppel való ütemezése. (Az előzőek segítségével alakítsuk át a feladatot maximális 
folyam meghatározásává; ennek megoldására használjuk Dinic módszerét.) 


7. 


Turing-gépek 


Ha az emberi agy olyan egyszerű lenne, hogy meg- 
érthessük, akkor túl egyszerűek lennénk ahhoz, 
hogy ezt megtehessük. AMERIKAI FALFIRKA 


Ebben a fejezetben elsődleges célunk az algoritmus fogalmának egy lehetséges 
pontosabb körülhatárolása. A fő eszközünk ebben egy egyszerű számítási modeti, 
az Alan M. Turing! angol kutató által kidolgozott Turing-gép lesz. A modell a szá- 
míitógép, a program egyszerűsített és bizonyos tekintetben idealizált változatának 
tekinthető. Egyszerűsége ellenére igen erőteljes konstrukció: minden olyan prob- 
léma, ami megoldható valamilyen algoritmus segítségével, kezelhetőnek bizonyult 
Turing-géppel is. A fejezet elején a Turing-gépekke! kapcsolatos egyszerű fogal- 
mak, eredmények szerepelnek, amiket aztán később gyakran fogunk használni, 
Sokáig úgy gondolták, hogy minden algoritmikus problémára van megoldás. 
Ha elég szívósan próbálkozunk, akkor előbb-utóbb legyűrjük a problémát. A har- 
mincas években, főként A. Church, K. Gödel és A. Turing munkássága nyomán 
kiderült, hogy ez távolról sem ígaz: vannak olyan feladatok, amelyekre nem létezik 


"Alan Mathison Turing (1912-1954) egyike volt századunk legjelentősebb gondolkodóinak. Si- 
keresen foglalkozott matematikával. a számítások elméletével és gyakorlatával, de filozófiával és 
agykutatássai is. Munkásságának egyik legnevezetesebb része a Turing-gép, és ehhez kapcsolódóan 
a kiszámíthatóság elméletének alapjai. Ezekről a fejezetben részletesen is lesz szó. A II. világháború 
alatt ő vezette azt a csoportot, amelyik feltörte a német tengeralattjárók által használt Enigma-kódot, 
Ennek óriási szerepe volt abban, hogy a szövetséges konvojok a normandiai invázióra készülve za- 





vartalanul közlekedhettek az atlanti vizeken, A háború után egyik vezéralakja volt az első brit szá- 





mítógép, az ACE tervezőgárdájának. Őt tekinthetjük a mesterséges intelligencia mint kutatási irány 
megalapozójának is, Ilyen tárgyú gondolatai — köztük a nevezetes Turing-teszf — mais nagy hatásúak. 
Megemlítjük még, hogy a sokak által számítástudományi-számítástechnikai Nobel-díjnak tekintett 
kitüntetés neve: ACM Turing Award, 
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megoldó módszer. Ennek a kérdéskörnek, a kiszámíthatóság elméletének az elemei 
jelentik a következő témát, amelyet tárgyalni fogunk. Megismerkedünk néhány ne- 
vezetes algoritmikusan eldönthetetlen feladattal (Megáltási probléma, Hilbert 10. 
problémája stb.). 

Korábban már foglalkoztunk információtömörítő módszerekkel. A Kolmogo- 
rov-bonyolultság segítségével itt azt tanulmányozzuk, hogy a véges jelsorozatok 
mennyire nyomhatók össze valamilyen algoritmussal. Ki fog derülni, hogy van- 
nak nem vagy csak alig összenyomható szavak, sőt, bizonyos értelemben az ilyen 
szavak a tipikusak. A módszer erejét alkalmazásokkal illusztráljuk. 

A fejezet végén egy másik gépmodellel, a közvetlen eléi géppel ismerke- 
dünk meg. A Turing-gépnek mint elméleti eszköznek az erénye az egyszerűség. 
Ugyanezen tulajdonsága miatt viszont túl nehézkes ahhoz, hogy a segítségével 
igazi algoritmusokat írjunk le. Programozási eszközként nagyobb büntetést jelen- 
tene a a legprimitívebb gépi kódnál is. A közvetlen elérésű gép számítóerő dol- 
gában, tehát a megoldható feladatok összességét tekintve egyenértékű a Turing- 
gépekkel. Másfelől a közvetlen elérésű gép sokkal jobban hasonlít az igazi számí- 
tógépek architektúrájára. Ezáltal módot ad arra, hogy szabatos, ugyanakkor gya- 
korlatias módon definiáljuk a programok időköltségét. 











74. A Turing-gép fogalma 


Hosszabb távú törekvésünk, hogy az algoritmus fogalmának egyik lehetséges pon- 
tos megközelítését adjuk. Ezt nagyjából úgy fogjuk tenni, hogy definiálunk egy 
számítási modellt, egy gépet, és azt tekintjük algoritmusnak, amit ezzel a gép- 
pel meg lehet valósítani. Ez a gép a Turing-gép lesz. A Turing-gép kevéssé ha- 
sonlít a ma használatos számítógépekre. Egy igen egyszerű központi részből és 
néhány szalagegvségből áll. A központi rész, amit véges vezérlőnek is neveznek, 
a gép munkája során véges sok lehetséges állapot valamelyikében van. A szala- 
gok cellákra vannak osztva. (Ezeket szokás még mezőknek, olykor négyzeteknek 
is nevezni.) Egy cellán a gépre jellemző rögzített véges jelkészlet, a szalagjetek 
halmazának egy eleme lehet. A szalagokat egyirányban végtelennek tekintjük. Ez 
az egyetlen sajátosság, amiben a Turing-gép erősebb a valóságos gépeknél. Mind- 
egyik szalaghoz tartozik egy író-olvasó fej, amely írhatjafolvashatja a fej alatti 
mezőt. A fejek mindkét irányban léphetnek a szalagjuk mentén. A szalagok ad- 
ják a Turing-gép adattárolási lehetőségeit; nincs külön belső memória és háttértár, 
mint az igazi számítógépeknél. 

A gép bemenete egy szalagjelekből álló véges sorozat, ami a számítás meg- 
kezdésekor az egyik szalagra van írva. A gép számítása lépések egymásutánjából 
áll. A gép egy lépésében elolvassa az éppen a fejek alatt levő jeleket, majd ezektől 
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és a központi egység belső állapotától függően ,.cselekszik". Az egyik lehetőség, 
hogy megáll, azaz nem tesz semmit. A másik lehetőség, hogy egy-egy jelet ír a 
fejek alatti cellákba, majd egy mezővel jobbra vagy balra lépteti, esetleg helyben 
hagyja a fejeket, és végül a központi egység új állapotot vesz föl. 

Ha a gép megállt, akkor megnézhetjük, hogy mi a számítás eredménye. A köz. 
ponti egység végső állapotát vagy pedig az egyik szalag tartalmát fogjuk ered. 
ményként értelmezni. Előfordulhat, hogy az adott bemenetre a gép sohasem ált 
meg. Ezt a jelenséget az igazi gépek világából vett, de itt a végtelen szalagok mian 
kissé pongyola szóhasználattal végtelen ciklusnak is nevezik. A következő ábra a 
Turing-gép felépítését szemlélteti, 











véges vezérlő 







input 
1 














Ezek után ismertetjük a Turing-gép formális definícióját. Legyen k egy pozitív 
egész. Egy k-szalagos Turing-gép egy hetessel jellemezhető: 
M-(O Tü I, 9. Fő), 
ahol 
02: egy véges halmaz, az M gép belső állaporainak halmaza. A gép a működése 
során mindig valamelyik g € 0 állapotban van. 
T: egy véges halmaz, a szalagjelek halmaza. Egy szalagmezőn mindig egy T- 
beli jel van. 


ü: egy kitüntetett szalagjel, az firesjet. A bemenetként felírt jeleken és a gép 
számítása során kiírt jeleken kívül minden szalagcellában ü van. Az ürésjelet 
tekinthetjük úgy, mint a még nem használt mezők tartalmát. 





I: ICTNY(ü) az input jelek vagy bemenő jelek halmaza, más szóval az input 
abc. A gépnek adott bemenetet az JI elemeiből kefi összeállítani. Az üresjel 
nem lehet input jel. 


7.1. A TURING-GÉP FOGALMA 193 


go: 40 € € a kezdő állapot. A gép a munka megkezdése előtt a go állapotban 
van. 


F: F C 0 az elfogadó állapotok haimaza. Bizonyos számításoknál csak egy 
kétértékű döntést várunk a géptől (pl. az igen-nem választ igénylő feladatok 
esetében). Ekkor csak azt nézzük, hogy a gép milyen állapotban állt meg. 
Az egyik választ az jelenti, hogy ez a végállapot F-beli, a másikat pedig az, 
hogy nem F-belt. Ezzel összhangban a 0) F-be tartozó állapotokat elutasító 
állapotoknak is nevezik. 


ő: Aö:0 XT" — 0 x (T x (jobb, bal, helvben))" egy parciálisan értel- 
mezett függvény, a gép ármenetfiiggvénye. Az átmenetfüggvény tekinthető a 
gép programjának. A ő függvény mondja meg, hogy ha a gép a g állapotban 
van, és az í-edik fej alatt levő szalagjel a; (1 £ í £ k), akkor mit kelj lépni. 
Ennek megfelelően a őíg; ai, az, . . . , ax) nincs értelmezve, ha ez a lépés a 
megállás. A többi esetben a ő(g; aj , a2, . . . , ax) érték 2k 4 1 összetevőből 
áll. Ezek: a gépnek a lépés utáni g/ € 0 állapota; továbbá az i-edik szalagra 
kiírt b; szalagjet, valamint az i-edik fej elmozdulása (1 £ í £ k). Az elmoz- 
dulás legfeljebb mezőnyi, ezért leírható a jobb, bal és helvben lehetőségek 
egyikeként. A ő függvényről még feltesszük, hogy az F-beli állapotokon 
nincs értelmezve. 


A ő parciátis függvény lényegében egy (nem mindenütt kitöltött) táblázatként 
fogható fel. Ez a táblázat írja le a gép programját. A Turing-gép a korábbiaknál 
kicsit pontosabban olyan gépnek tekinthető, amely egyetlen program futtatására 
képes. 

Az I input abc elemeiből álló véges sorozatokat szavaknak nevezzük. Az I 
jeleiből (betűiből) alkotott szavak halmazát I"-gal jelöljük. I" részhalmazait nyel- 
veknek nevezzük. Egy L C I" nyelv elemeit az E nyelv szavainak nevezzük. 

A Turing-gép első szalagját input szalagnak ís nevezzük, mivel azon lehet a. 
bemenetet megadni. Bizonyos esetekben hasznos, ha kijelölünk egy output szala- 
got is. Ez annyit tesz, hogy a gép megállása után az eredményt ennek a szalagnak 
az elejéről olvassuk le. Az output szalag megadása nem több, mint a végeredmény 


megjelenési helyére vonatkozó előírás. 





A Turing-gép működése 

A gép a működés előtt kezdőhelyzetben van. Ez azt jelenti, hogy a gép állapota a 
9 kezdőállapot, az író-olvasó fejek a szalagjaik első cellájára mutatnak, az s € 
TP bemenet az első szalag elejére van írva, az összes többi mezőn az Ü üresjel 
található. 
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A gép a kezdőhelyzetből indulva lépéseket tesz. A lépések tartalmát jelentő 
változásokat a ő függvény írja le: a lépés előtti állapotnak és a fejek alatti jeleknek 
megfelelő ő-érték adja meg az új állapotot, a kiírandó jeleket és a fejmozgásokat, 
Ha a gép egy olyan helyzethez ér, amelyre ő nincs értelmezve, akkor megáll. Ez 
történik egyebek között akkor, ha a gép elfogadó (azaz F-beli) állapotban van. 








A Turing-gép számításának eredménye 

A Turing-gépeket kétféle üzemmódban fogjuk tekinteni. Egyfelől nyelvek felis- 
merésére, másfelől függvények kiszámításra használjuk őket. Az utóbbi típusú 
feladatok eléggé természetesek a számítástechnikában, a velük való foglalkozás 
így nem igényel különösebb indoki Ami a nyelvek felismerését illeti, ezek 
olyan feladatoknak tekinthetők, ahol a számítás eredménye egyetlen bít: egyet- 
len eldöntendő kérdésre kell választ adni. Az ilyen feladatok elméleti szempontból 
egyszerűbben megfoghatók, ugyanakkor elég gazdag a struktúrájuk ahhoz, hogy 
segítségükkel a számítások általános tulajdonságairól képet kaphassunk. 














Definíció (Turing-gép által felismert nyelv): 

Az M Turing-gép által felismert Lm nyelv azokból az 8 € I" szavakból áll, ame- 
tTvekkel mint bemenerekkel elindítva az M megáll, mégpedig elfogadó (azaz F-beli) 
állapotban. 


Ez a fogalom tulajdonképpen az igen-nem kérdések eldöntésének felel meg: 
képzeljük el, hogy van egy általános kérdésünk, ami az I" minden egyes szavára 
értelmes, és a válasz egy szó esetén ígen vagy nem. Például a kérdés lehet az, hogy 
az s € I" szó tartalmazza-e a 0 jelet. Egy ilyen kérdésnél azok a szavak, ame- 
lyekre a válasz igenlő — az ún. igenpéldányok —, egy L C FT" nyelvet alkotnak. 
Ha L — Lm, vagyis az igenpéldányokból álló nyelv éppen az M által felismert 
nyelv, akkor úgy tekinthetjük, hogy az M gép gyenge értelemben eldönti a kérdést. 
Ha s € I" igenpéldány. akkor ezt M véges sok lépésben megállapítja azzal, hogy 
megáll elfogadva 5-et. Ha s nem egy igenpéldány, akkor cizelláltabb a kép. Lehet. 
hogy M ekkor is megáll, szükségképpen elutasító állapotban, amit úgy értelmez- 
hetünk, hogy ebben az esetben is sikerült megválaszolnia a kérdést. A definíció 
megengedi viszont azt ís - és ez a gyenge magyarázata —, hogy a gép s 8 Lu 
esetén sose álljon meg. Az M tehát általában véve egy fél algorítmusnak tekint- 
hető az L-nek megfelelő kérdés megválaszolására. Az Lw szavaira jól működik. 
az TM Em szavainál viszont végtelen ciklusba keveredhet. 


Definíció (Turing-gép által kiszámított függvény): 
Legyen M egy kitüntetett oiput szalaggal rendelkező Turing-gép. Az M áltat ki- 
számított fag : I o PP parciális függvényt így értelmezzük: fm(5) — w, ha M 
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az s € D inputtal indulva megátt, és megállás után az output szalagon a w € I" 
szó szerepel az üresjelek óceánja előtt. 


Az fm függvény tehát csak azokra az s € I" szavakra értelmezett, amelyek- 
kel mint bemenetekke! az M gép véges sok lépés megtétele után megált. Ennél a 
számítási módnál közömbös, hogy a megállás elfogadó vagy elutasító állapotban 
történt-e. Az fm(s) eredmény pedig a kitüntetett szalag legnagyobb kezdődarabja, 
ami csupa J-beli betűből áll. 


Példák: I. A következő igen egyszerű egyszalagos M gép bizonyos értelemben a 
hárommal való oszthatóságot dönti el. Legyen tehát X : I, és 


2 — (do.a1.42.90h T-(01ü), 1— (01), F— (gy. 


A gépnek négy állapota van, ebből egy elfogadó állapot. A bemenetet a 0 és 1 je- 
lekből lehet összeállítani. Mivel M-nek egy szalagja van, a ő függvény (állapot, 
szalagjel) alakú párokhoz rendel (állapot, szalagjel, fejmozgás) összetételű hárma- 
sokat. Legyen ezek után ó a következő: 


ő(go.1) — (g.Ljobb), ő(go,ü) — (go. ü helyben), 
ó(gi 1) (42, 1. jobb),  6(g2,1) — (go, 1, jobb). 


Tegyük még fel, hogy más párokra ő nincs értelmezve. Az M átmeneteit nézve 
megállapíthatjuk, hogy ha 0 jelet olvas, akkor megáll elutasító, azaz nem elfogadó 
állapotban, Nincs ugyanis a ő értelmezési tartományában olyan pár, ami a 0 sza- 
lagjelet tartalmazza. Ugyanez a helyzet az ü üresjellel is, kivéve, ha az állapot go, 
mely esetben M a fejet helyben hagyva átmegy a gy elfogadó állapotba. Érde- 
kesebb, ami egyes olvasásakor történik. Ha a gép állapota ekkor az, akkor a gép 
érdemi írás nélkül (ugyanazt írja vissza amit olvasott) jobbra lép, és átmegy a 4i-41 
állapotba; ítt az összeadás modulo 3 értendő. Figyelembe véve még azt is, hogy M 
a go állapotból indul, mindezekből arra jutunk, hogy M pontosan azokat a szava- 
kat fogadja el, amelyek csupa egyesekből állnak, és a hosszuk osztható hárommal. 
Az M által felismert Lw nyelv tehát 


Lm — (17 : n hárommal osztható természetes szám). 
Itt 17 az n darab egyesből álló szó jelölése; speciálisan zik 


2. Az itt szereplő egyszalagos M" gépet mindkét üzemmódjában megnézzük. Meg- 
határozzuk az Lm nyelvet és az fm függvényt is. Utóbbihoz output szalag is kell. 
Nincs sok választásunk: az egy szem szalagot használjuk erre a célra is. Legyen 


0 s (dordoh; TST0 1 űj) TEf01) Fzsde) 
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és 
ó(go, 0) — (go, 0, helyben), ó(go, 1) — (go, 1, jobb), ő(go, ü) — (gy. 1, helyben). 


Másutt ő nem definiált. Az M" a gy belső állapotban maradva lépdel jobbra a 
szalag mentén, amíg 0 vagy ű jelet nem talál. Az előbbi esetben végtelen cík- 
lusba kerül, az utóbbiban pedig még egy 1-est ír az input után, majd megát 
elfogadó állapotban. A gép tehát a csupa egyesekből álló szavakat fogadja el: 
La - (1";n 2 Oegész). Az M! csak az Lm szavaira áll meg, így ez a 
nyelv az far parciális függvény értelmezési tartománya. A gép az 17 bemene- 
ten az I"t! eredményt adja, vagyis fwr(17) - IT. Az M" gépet tekinthetjük az 
f(n) :— n- 1 függvényt kiszámító algoritmusnak. 


Feladat: Az 1. példabeli M gép az unárisan ábrázolt n számról eldönti, hogy az 
hárommal osztható-e. Szerkesszünk olyan N Turing-gépet, amelyik a binárisan 
megadott n bemenettel teszi ugyanezt. 


Talán az előző példák hihetővé teszik, hogy tényleg lehet számításokat vé 
gezni Turing-gépekkel. A tényleges gépek és a Turing-gépek számítóereje közötti 
kapcsolat további hangsúlyozásául megjegyezzük, hogy utóbbiak leírhatók prog- 
rammal. Egy lehetséges megoldás, hogy helyet foglalunk a szalagok véges darab- 
jainak. Ezeken nyílvántartjuk a fejek helyzetét; legyenek ezek az fi, fz..... Ík 
változókban. A gép mindenkori belső állapotát pedig a g változóban tároljuk. Ezu- 
tán egy végtelen ciklust szervezünk, aminek magjában a következők szerepelnek: 





§ Az olvasófejek alatti szalagjelek beolvasása az 1, . . . , t4 változókba. 


s aó táblázat minden bejegyzésére egy programrészlet a következő minta sze- 
rint: a ő(gi; a1, az... ax) 7 (gi (br, bal), (ba, helyben), . . . , (b. jobb) 
érték megfelelője legyen 





if g— a; and zz — az and 2 — az and ... and xy — az then begin 






g:— dj 
2 :7 bi; x2:z ba; ...; This br; 
Az x; tartalmának ki az f; változókkal azonosított helyekre 
(i71,2,...,k); 
fh: fh—k.. fs fetl 
end; 


s Megállás abban az esetben, ha ő az adott helyen nincs értelmezve. 
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Az irodalomban a Turing-gépeknek többféle, a részletekben kisebb-nagyobb 
eltéréseket mutató meghatározásával találkozhatunk. Ilyen eltérés lehet, hogy a 
szalagokat mindkét irányban végtelennek vesszük. Az eltérések azonban elméleti 
szempontból nem jelentősek; a különböző géptípusok egyenértékűsége némi mun- 
kával igazolható. Könnyen átalakítható például egy Turing-gép ugyanazt a nyelvet 
felismerő, de csak egyetlen elfogadó állapottal rendelkező géppé. Ennek meggon- 
dolását az olvasóra bízzuk. 


7.2. Idő- és tárigény 


A Turing-gép mint modell egyik erénye, hogy segítségével elég egyszerűen vizs- 
gálhatjuk a számítások idő- és tárigényét. Az M Turing-gép számolási ideje az s 
inputon a megállásáiíg végrehajtott lépések száma, tárigénye pedig a felhasznált 
(olvasott) szalagcellák száma. Ha a gép input szalagja csak olvasható, akkor előír- 
hatjuk, hogy ez a szalag ne számítson bele a tárigénybe. Hasonló a helyzet a csak 
írásra szolgáló output szalaggal (amin sosem léphetünk balfelé). Az a megfontolás 
ált emögött, hogy kizárólag az érdemi munka helyigényét mérjük, és ne foglalkoz- 
zunk a bemenet olvasásának és az eredmény írásának (elkerülhetetlenül fellépő) 
költségével. Úgy is fogalmazhatunk, hogy csupán a munkaszalagokon, az írásra és 
olvasásra is használatos szalagokon felhasznált hely számít. 

A hárommal való oszthatóságot eldöntő M gép számolási ideje az 1" bemene- 
árigény függ attól, hogy miként szemléljük a szalagot. Tekinthetjük 
csak olvasható input szalagnak, hiszen a gép sohasem írja (ami azt jelenti, hogy 
mindig a régi értéket írja a fej alatti mezőbe). Ekkor a tárigény minden bemene- 
ten 0. Ha viszont a szalagot munkaszalagnak vesszük, akkor az 17 bemeneten a 
tárigény n 4 1 lesz. Az f(n) :— n 4 1 függvényt kiszámító M" gép számolási 
ideje az 1" szóra n -- 1, az 110 szóra pedig végtelen, hiszen a 0 olvasása után M" 
végtelen ciklusba esik. A szalagot tekinthetjük csak írható output szalagnak, mert 
a gép sohasem lép balra. Ekkor a tárigény minden bemeneten 0. Ha viszont mun- 
kaszalagként szemléljük, akkor 1"-nél a tárigény n 4 1, az 110 bemeneten pedig 
ms 








Szeretnénk beszélni az algoritmusok (Turing-gépek) sebességéről, illetve tár- 
felhasználás szerinti hatékonyságáról. Ebben túlságosan elaprózott megközelítés 
lenne, ha minden s € I" szóra külön vizsgálnánk a lépésszámot vagy a tárigényt. 
Ennél egyszerűbb, de még mindig elég informatív megoldást kapunk, ha a bemenet 
hosszának függvényében vizsgáljuk ezeket az igényeket. 


Jelölje Tu(n) az M gép maximális számolási idejét az n jelből álló bemeneteken. 
Az n hosszú szavakon a maximális tárigényt Sm(n)-nel jelöljük. 
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Ha van olyan n jelből álló s € I" szó, amellyel elindítva M nem áll meg véges 
épés után, akkor Tw(n) értékét végtelennek tekintjük. Hasonló mondható az 
Sm függvényről is. 

A hárommal való oszthatóságot tesztelő M gépre Tw(n) — n 3- 1, ha pedig a 
szalagját munkaszalagnak vesszük, akkor Sm(n) — n- 1. Ami az M" gépet illeti, 
Tw(n) — c00, han 5 0, hiszen a nullát tartalmazó bemeneteken a gép nem áll 
meg. Ha M" szalagja munkaszatag, akkor Smr(n) nál 

A Tu és Sm függvények segítségével lehetőség nyílik arra, hogy algorítmuso- 
kat hatékonyság szempontjából összehasonlítsunk. Ha például M és N két Turing- 
gép, melyekre Twín) c Twí(n) teljesül minden elég nagy n-re, akkor az M al- 
goritmust gyorsabbnak mondhatjuk az N algoritmusnál, Ily módon beszélhetünk 
arról, hogy egy adott feladatot megoidó két módszer közül az egyik hatékonyabb, 
mint a másik. 

Algorítmikus problémák megoldása során igyekszünk minél jobb módszereket 
találni. Ha például az £ nyelv időben hatékony felismerése a feladat, akkor olyan 
M algoritmust keresünk, amelyre a Tw(n) függvény elég lassan nő. Természetes 
törekvésnek tűnhet, hogy ilyen értelemben a légjobb módszert keressük. Legjobb 
módszer azonban nem feltétlenül létezik, amint azt a következő tétel mutatja, 








Tétel (gyorsítási tétel): Van olyan L nyelv, amelyre igazak az alábbiak: 

I. Az L felismerhető egy olyan M Turing-géppet, melyre Tw(n) véges minden n- 
Fe. 

2. Tetszőleges, az L-et felismerő N Turing-géphez van olyan N" Turing-gép, 
amelyre IL, — EL szintén teljesül, továbbá Tgr(n) — O(log Tw(n)). 


u 

A bizonyítást mellőzzük. A tételbeli L nyelvet felismerő bármely algoritmus 
exponenciálisan felgyorsítható. Ezért nem létezhet a feladatra leggyorsabb algo- 
ritmus. A feladatok idő- és tárigényének értelmezésében tehát óvatosabban kell 
eljárni, A következő fejezet elején visszatérünk ehhez a gondolatkörhöz. 


7.3. Néhány szimuláció 


Ebben a szakaszban néhány olyan tényt ismertetünk, amelyek azt mondják, hogy 
bizonyos típusú Turing-gépek helyettesíthetők, szimulálharók másfélékkel. A szí- 
muláló gép egyenértékű az eredetivel abban az értelemben, hogy ugyanazt a nyel- 
vet ismeri fel, illetve ugyanazt a függvényt számítja ki. Bemelegítőnek egy feladar 
tot ajánlunk: 

Feladat: Legyen M egyszalagos Turing-gép. Módosítsuk M-et úgy, hogy a ka- 
pott M" gép egyenértékű legyen M-mel, azaz Lm — Lm Ím — Íme teljesüljön; 
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továbbá az M" gépnek pusztán az aktuális állapotából kiderüljön, hogy mi volt a 
szalagjel, amit utoljára olvasott. (Az M" gép állapotai legyenek ga és a (g, a) alakú 
párok, ahol go, g az M állapotai, a pedig az M szalagjele. Az M gép ő átmenet. 
függvényét terjesszük ki a párokra úgy, hogy az első komponensnek megfelelően 
utánozzuk M lépését, a második komponens pedig az éppen olvasott szalagjelnek 
feleljen meg.) 


A feladattal azt szerettük volna érzékeltetni, hogy a belső állapotok segítsé- 
gével fenntarthatunk a gépben egy rögzített méretű memóriát. Hasonló megoldás- 
sal tárolhattuk volna mondjuk a fej helyzetének modulo 5 osztási maradékát vagy 
bármi más korlátos mennyiségű információt. 

A szimulációs eredmények egy része olyasmit mond, hogy az egyszerűbb gé- 
pek viszonylag kézben tartható hatékonyságvesztéssel meg tudják tenni ugyanazt, 
amit a bonyolultabbak. A következő eredmény szerint az, amit el lehet végezni sok 
szalaggal, véghezvihető egyetlen szalaggal is. A tétel gyakran ad módot arra, hogy 
csak egyszalagos gépekre korlátozzuk a figyelmünket. 


Tétel; Legyen M egy k-szalagos Turing-gép. Van olyan egyszalagos M" Turing- 
gép, melyre 
Lm 7 Lm (Wagy fm — fm), továbbá 


Tw(n) £ 2Tj(n), 
Sm(n) S Smín) tn. 





Bizonyítás: M" építésekor az M-hez képest alaposan felfújjuk a szalag abc-t, és 
megnöveljük a belső állapotok számát is. Az M" egyetlen szalagján 2k csík lesz. A 
21—1-edik csík felel meg az M í-edik szalagjának, míg a 2i-edik csíkban az i-edik 
fej helyén egy megkülönböztető jel, x szerepel. Az M" szalagjának egy mezején k 
eredeti szalagjelet és k darab fej-helyzetről tájékoztató jelet kódolunk. 




















1.szalag MDTI--JAp--]B 
1. fej Ld tákáti ÉL ER 
k.szalag ) D[---[D 

k. fej Pesze jltefoyesf ak 























A rajzon egy oszlop felel meg az M! egyetlen szalagmezejének. Az ábrázolt hely- 
zet az M szalagjainak azt az állapotát tükrözi, amikor az első és a k-adik szalag 
első mezején is D van, az első fej alatt A, a k-adik fej alatt pedig B olvasható, stb. 
Az M"-nek összesen (2t)" szalagjele van, ahol t az M szalagjeleinek a száma, 
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M" az M gép egy lépését egy legfeljebb 27 (n) lépésből álló menetben utá- 
nozza. Először a szalag elejéről indulva jobbra elmegy a legmesszebb levő z jelig, 
és közben leolvassa az r-ek felett található eredeti szalagjeleket. Ezeket a belső 
állapotaiban tárolja. (Ezt a feladatban javasolt módszerrel teheti.) A menetelés so- 
rán egy hellyel jobbra mozdítja az útjába eső r-eket, kivéve az utolsó oszlopban 
levő(ke)t. Ebben a helyzetben a gép ismeri M állapotát és a fejei alatti jeleket, így 
meghatározhatja a M következő állapotát és a kiírandó jeleket. 

Ezután M" legfeljebb egyet lép jobb felé, majd egyenesen visszabaktat a sza- 
lag elejére. Eközben kiírja az AM fejeinek régi helyére a k darab jelet, amiket M 
írt volna, és az M fejmozgásainak megfelelően áthelyezi az T-eket. Utóbbiaknál 
hasznos, hogy korábban jobbra léptettük ezeket a jeleket. Így mindezek megold. 
hatók úgy is, hogy csak balfelé megyünk. 

Ha n jelből álló bemenettel kezdjük a munkát. akkor egy meneteben az M" feje 
legfeljebb Twín) lépést tesz jobbra, következésképpen legfeljebb ugyanennyit 
mehet balra. Az M egy lépését így nem több, mint 2Tmín) lépéssel szimulál- 
tuk. Az M" pontosan akkor álljon meg (fogadja el a bemenetet), ha M ezt teszi, 
Így a számolási idő Tar (n) c 2TutmTuín) — 2T3(n). 

Ha függvényt számítunk, akkor az utolsó lépés visszatérő fázisában az M 
output szalagjának megfelelő csíkot kivéve mindenhova üresjelet írunk. Tesszük 
mindezt azért, hogy az eredmény az M bemenő betűivel legyen írva. 

A tárra vonatkozó állításból ezután csak a 4-n tag szorul némi magyarázatra. 
Ez azért szerepel, mert ha M-nek kitüntetett input szalagja volt, akkor a bemenet 
hosszát, ami n, nem számítottuk bele Sx(n)-be. 

a 


A következő tétel szerint a szimuláció idővesztesége kisebb lesz, ha egy helyett két 


szalagot engedünk meg. A bizonyítás az előbbinél bonyolultabb; nem részletezzük. 


Tétel: Az M k-szalagos Turing-géphez megadható olyan 2-szalagos M" Turing- 
gép, amely az előbbi értelemben szímulálja M-et, 





Tuw(n) £ O(Tu(n) logTm(n)), és 
Sm(n) £ Smtn) 4-n. 
im] 


A most terítékre kerülő tény azt sugallja, hogy az algoritmusok időigényét sok 
esetben legfeljebb csak állandó szorzó erejéig érdemes nézni. A Turing-gép al- 
kalmas megválasztásával ugyanis a multiplikatív konstans majdnem tetszőlegesen 
lefaragható. 
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Tétel: Tegyük fel, hogy az M Turing-gép az L, nyelvet ismeri fel, és Tw(n) £ en 
teljesül egy c 5 0 állandóval, Ekkor tetszőleges e 2 0-ra van olyan L-et felismerő 
M" Turing-gép ís, hogy alkalmas ng € N számmat 


Twr(n) £n(1-4 e), hun 2 no. 


Bizonyítás: Az M! gépet úgy tervezzük, hogy az M sok egymás utáni lépését ke- 
vés lépésben utánozni tudja. Pontosabban egy kellően nagynak választott im szám- 
mal az fog teljesülni, hogy a régi gép m lépését az új legfeljebb 7 lépésben elvégzi. 
Osszuk fel evégből az M szalagjait m egymás utáni mezőből álló blokkokra. Egy 
ilyen blokk tartalmát az M" egyetlen szalagjelben tárolja. Eszerint, ha M-nek t 
szalagjele van, akkor az új gép t" betűt használ. Az M"-nek eggyel több szalagja 
lesz, mint M-nek, Az elsőn, amit csak olvas, az M bemenete szerepel. Ennek tar- 
talmát az érdemi munka előtt átkódolja egy másik szalagra, utána a régi bemenő 
szalaggal nem foglalkozik. A többi szalag — tömörebb kódolással — ugyanazt fogja 
tartalmazni, mint az M megfelelő szalagjai, 

Nézzük most, hogy mi történik a szalagokkal az M gép m egymást követő 
lépése során! A lényeges észrevétel, hogy ami ezalatt végbemegy, az csak a fe- 
jeket tartalmazó blokkoktól és azok közvetlen szomszédaitól függ, hiszen a fejek 
legfeljebb m cellányira mozdulhatnak el. Változások is csak eme blokkokban le- 
hetségesek. 

M? tehát nagy vonalakban a következőket teszi; szalagonként három szom- 
szédos jel (ami három blokkot jelent M -nél) megvizsgálása után M átmeneteinek 
ismeretében a , memóriájában" meglépi M következő m lépését. Ezután az ered- 
ménynek megfelelően felülírja a szomszédos mezőhármasokat, majd helyükre te- 
szi a fejeket. A szükséges memória a feladatban vázolt eljárással képezhető. 

Ezek szerint az m lépés szimulációjához a szalagok olvasása-t írása elvégez- 
hető egy bal-jobb-jobb—bal-bal lépéssorozatban (a szalagok elején ennél rövideb- 
ben is). Legfeljebb további két jobbralépés szükséges lehet, amikor az M hely- 
zetének megfelelő blokkokra állítjuk az M" fejeit. Így M" legfeljebb 7 lépésben 
elvégzi az M gép m lépését. A bemenet átkódolása, majd a kódolt szalagon a 
fejnek a szalag elejére mozgatása összesen n 4 [21 lépésben megtehető. Az M" 
lépéseinek számát így becsülhetjük: 
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Hasonló érveléssel megmutatható, hogy ha him inf... , as Eme — oo, akkor M" 
választható úgy, hogy tetszőleges c 5 0-ra és elég nagy n-re Tw:(n) € eTm(n) 
teljesüljön. 

A szimulációs eredményeket azon az áron értük el, hogy mind a jelek szá- 
mát, mind a belső állapotok számát megnöveltük. Számítógépes hasonlattal élve: 
komolyabb, bonyolultabb , hardvert" használtunk. Nagyobb (több állapotú) a köz- 
ponti egység. és nagyobb a jelhalmaz is. A fordított irányt illetően megjegyezzük, 
hogy — konstansszoros hatékonyságvesztés árán — a szalagjelek száma a szokásos 
bináris kódolással 2-re csökkenthető. 

Megemlítjük még, hogy a legutóbbi tétel huncutság abban az értelemben, hogy 
a szalagjelek számának korlátlan növelhetőségére építettük a bizonyítást. Az érde- 
kes tanulság ebből az, hogy a Tering-gépmodellben a feladatok időigénye függ a 
jelkészlet méretétől, 





7.A. A kiszámíthatóság alapfogalmai 


Ebben és a következő néhány részben az algorítmussa! való kiszámíthatóság ha- 
tárait feszegetjük. Hogy erről értelmesen beszélni tudjunk, pontosan meg kell ha- 
tároznunk az algoritmus fogalmát. Azt fogjuk algorítmikusan kiszámíthatónak te- 
kinteni, ami Turing-géppel kiszámítható. A továbbiakban legyen / egy nem üres 
véges halmaz. Olyan gépekkel fogunk foglalkozni, melyeknek az input abc-je I. 


Definíció (rekurzíve felsorolható nyelv): Az L C I" nyelvet rekurzíve felsorol- 
hatónak nevezzük, ha van olyan M Turing-gép. melyre L— Lm. azaz a gép által 
felismert nyelv éppen L. 


Ahogy már korábban említettük, ez annyit tesz, hogy van egy fél algorit- 
musunk az L (illetve a neki megfelelő igen-nem kérdés) eldöntésére. Megeshet 
ugyanis. hogy egy s € I Y £ szóval elindítva az M nem áll meg. A végtelen 
ciklusok kizárásával kapjuk a következő fogalmat: 


Definíció (rekurzív nyelv): Az L C I" nyelv rekurzív, ha van olyan M Turing- 
gép, melyre E - Lm, és M minden s € !F szóra megáll. 


Nyilvánvaló, hogy egy rekurzív nyelv rekurzíve felsorolható is. A rekurzív, 
illetve rekurzíve felsorolható nyelvek halmazára az R, illetve RE jelölést használ- 
juk: 

RE-DÍLEI: Lrekurzíve felsorolható). 
R-(ILCI: Lrekurzi 


Analóg fogalmak értelmezhetők (parciális) függvényekre: 
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Definíció (parciálisan rekurzív függvény): Az f : I I" parciális függvény 
parciálisan rekurzív függvény, ha létezik olyan M Turing-gép. hogy f — fw. Ha 
ezen túl még f minden s € I" ínpurra értelmezve van, akkor f egy rekurzív függ- 
vény. 


A meghatározásból azonnal kiviláglik, hogy egy rekurzív függvény egyben 
parciálisan rekurzív is. A rekurzív elnevezés onnan ered, hogy a rekurzív függvé- 
nyek éppen azok a függvények, melyek bizonyos egyszerű függvényekből rekurzió 
segítségével felépíthetők, Ezzel a szintetikusnak mondható megközelítéssel nem 
foglalkozunk. A rekurzíve felsorolható kifejezés arra szándékozik utalni, hogy a 
nyelv szavai egy alkalmas eljárással felsorolhatók. Erre később (7.7.2. szakasz) 
még visszatérünk. 

A rekurzív nyelveket és a rekurzív függvényeket fogjuk algoritmussal kezel- 
hető nyelveknek és függvényeknek tekinteni. Felmerülhet a kérdés, hogy nem túl 
szűk-e ez a meghatározás. Nincsenek-e olyan algoritmusok, amelyek nem valósít- 
hatók meg Turing-géppel? Például Pascal-programmal nem lehet-e több függvényt 
kiszámítani? Első hallásra talán meglepő lesz a válasz: számos kísérlet ellenére 
sem sikerült eddig olyan algoritmusfogalmat megadni, amely egyrészt megvalósít- 
ható a gyakorlatban, másrészt a Turing-kiszámíthatóságnál erősebb. Így például. 
ami elvégezhető Pascal-programmal, arra szerkeszthető Turing-gép is. Erre — a 
közvetlen elérésű gép kapcsán - látunk majd bizonyítékot. A Turing-gépeknek ezt 
a figyelemreméltó tulajdonságát fogalmazza meg a Church-Turing-tézis. 
Church-Turing-tézis: Ami algoritmussal — azaz véges eljárással — kiszámítható 
(eldönthető), az Turing értelmében kiszámítható (eldönthető). Nevezetesen: 





9 Egy f: It o I" parciális függvény kiszámítható áz. f parciálisan rekur- 
E váj egvén) 


zív. 
e Egy f:I- I" (teljes) függvény kiszámítható ts f rekurzív. 


e Egy L C ! nyelvre a nyelvbe tartozás problémája algoritmussal eldönthető 
8 L rekurzív. 


Hangsúlyoznunk kell, hogy ez a tézis nem tekinthető formálisan bizonyított 
állításnak. Azt a rapasztalati tényt fejezi ki csupán, hogy eddig nem sikerült a 
Turing-gépek erejét meghaladó realisztikus számítási modellt találni. Megtörtén- 
het — noha nehéz elképzelni -, hogy valaki kitalál egy megvalósítható számító- 
eszközt, amivel nem rekur ggvények is kiszámíthatók. Egy ilyen fejlemény 
megdöntené a Church-Turing-tézist. 














204 7. TURING-GÉPEK 


A Church-Turing-tézist elfogadva a következő két állítás úgy értelmezhető, 
hogy nem lehet mindent algoritmussai eldönteni, illetve kiszámítani. Vannak algo- 
ritmussal nem felismerhető nyelvek és nem kiszámítható függvények. 


ÁMítás: Van olyan L" € I" nyelv, amely nem rekurzíve felsorolható, 


Bizonyítás: Egy Turing-gép leírható véges jelsorozattal, pl. magyarul. Ezért az 
összes gép számossága megszámlálható. Ez annyit tesz, hogy mind felsorolható 
természetes számokkal sorszámozva. Legyen Mg, Mi, Ma, . . . egy ilyen felsoro- 
Jás. A gép egyértelműen meghatározza az általa felismert nyelvet, vagyis a rekur- 
zíve felsorolható nyelvek is sorszámozhatók a természetes számokkal úgy, hogy 
egy se maradjon ki: Lmo, Em Emma: : .. Elég megmutatni ezután, hogy az EC I" 
nyelveket nem lehet ilyen módon megszámozni. Ebből egyből következik, hogy 
van olyan [7 nyelv, ami nem nyelve egyetlen gépnek sem. (A halmazelmélet ele- 
meiben jártas olvasónak: a rekurzíve felsorolható nyelvek halmaza megszámlál- 
ható, az összes nyelvé pedig kontinuum számosságú.) 

Az I" elemei, a véges hosszúságú, [-beli jelekből képzett szavak is megszá- 
mozhatók természetes számokkal. Hasznos számozást ad a kanonikus felsorolás: 
vegyük először az üres szót, majd soroljuk fel az 1 hosszúakat, utánuk a 2 hosszú- 
akat, és így tovább. Az azonos hosszúságú szavak az I" lexikografikus rendezése 
szerint kövessék egymást. Ehhez feltesszük, hogy adott az / halmazon egy rende- 
zés, A kanonikus felsorolás az I" szavainak egy wa, ui, wa, . . . sorrendjét adja. 









Megmutatjuk ezután, hogy van olyan L/ € I" nyelv, amely nem lehet benne a 
rekurzíve felsorolható nyelvek Lo, Em, Emav . . sorozatában. Az L" nyetvnek 
a w; szó pontosan akkor legyen eleme, ha w; 8 Lm, i — 1,2,. . .. Az L/ definíci- 
ója korrekt, Ugyanis tetszőleges w E I" szóról egyértelműen rendelkeztünk, mert 
minden szó pontosan egyszer szerepel a kanonikus felsorolásban. 

Az L" nyelv nem egyezhet meg egyetlen Lm, alakú nyelvvel sem, hiszen a 
wi szó L" és Lm, közül az egyiknek eleme, a másiknak nem. Az L" tehát nem 
rekurzíve felsorolható. C 


Az eljárást, amellyel L"-t meghatároztuk, Cantor-féle átlós módszernek nevez- 
zük. Az elnevezés egyik lehetséges magyarázata a következő. Az 7 feletti nyelvek 
és a végtelen , igen-nem" sorozatok között F" kanonikus felsorolása alapján köl- 
csönösen egyértelmű megfeleltetés hozható létre: egy L C IT" nyelvnek az a soro- 
zat felel meg, melynek az i-edik tagja pontosan akkor , igen", ha 2-ben benne van 
a u szó. Készítsünk egy táblázatot, aminek az í-edik sora az Lm,-nek megfelelő 
igen-nem sorozat, A táblázat oszlopait a w; szavakkal indexeljük. 
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Wo u ge 104 Wig-1 

Lmo ) nem nem art nem — nem 

Em [igen nem -. nem nem 

Lm, ] nem igen ... igen nem 

Lisa ) igen nem -.-. nem nem 
F7d igen igen — ... nem igen 


Az L/ nyelv sorozatát — ami a rajzon az alsó sorban van — úgy kapjuk , hogy 
a táblázat főátlójában levő elemeket az ellenkezőjükre változtatjuk. A Cantor- 
módszer alapvető eszköz a kiszámíthatatlansági eredmények igazolásában. 


Függvényekre a megfelelő állítás az előzőhöz hasonlóan bizonyítható. Itt azt 
lehet megmutatni, hogy az összes f : I" c I" függvényt nem lehet felsorolni. 


Áltítás: Létezik olyan f : I" o I" parciális függvény, amely nem parciálisan 
rekurzív. CI 


7.5. Az univerzális Turing-gép 


Ennek az előkészítő jellegű résznek a tanulsága úgy foglalható össze, hogy fordí- 
tóprogramok pedig léreznek. Ezen senki sem lepődik meg különösebben, hiszen 
se szeri, se száma a különféle fordítóprogramoknak. Olyan programok ezek, ame- 
lyek képesek más programokat értelmezni, futtatni. Szinte el sem lehet képzelni 
nélkülük a számítógépes világot. Létezésük tehát hasznos tény, Ugyanakkor, mint 
később látni fogjuk, természetesen vezetnek algoritmussal kezelhetetlen feladatok- 
hoz. 

Az univerzális Turing-gépek a fordítóprogramok népes családján belül az in- 
terpreterek közé tartoznak. Bemenetük két részből áll. Az egyik komponens az in- 
terpretálandó program, ami egy M Turing-gép leírása. Az M-ről kényelmi okok- 
ból feltesszük, hogy egy szalagja van, a bemenő abc-je I — (0,1j, és egyetlen 
elfogadó állapota van (IFi — 1). A szímulációk kapcsán láttuk, hogy az elfo- 
gadó/kiszámító képesség szempontjából ezek nem lényeges megszorítások: bár- 
mely W gép átalakítható ilyenné úgy, hogy a kapott új gép is az Év nyelvet ismerje 
fel, illetve az fv függvényt számolja ki 

Az univerzális gép bemenetének másik része az interpretálandó M gép tet- 
szőleges s € I" bemenete. Az univerzális gép az M leírását, más szóval kódjár 
értelmezve lépésről lépésre utánozza M működését az s bemeneten. 
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Az első teendő tehát, hogy az interpretálandó M gépből , adatot" csináljunk, 
amit majd az univerzális gép olvasni tud. Ez nem különösebben nehéz. Arra kell 
ügyelnünk csupán, hogy minden M gép kódja egy véges bitsorozat legyen, és a 
kódolás/dekódolás algoritmussal (Turing-géppel vagy Pascal programmal) elvé. 
gezhető legyen. 








A Turing-gépek egy lehetséges kódolása 
Tegyük fel, hogy k — 1, M — (O.T,I,ü,ő,go.F). IT — (0.1) és [FI — 1 
Azt is feltehetjük, hogy a gép megadásában szereplő szimbólumok mind számok. 
Mondjuk legyen 

e T7-(0,1), T—(0,1,...,t), ü—t, 

s 0—(0,1,...,g), 90—0, F- (a). 

e balra — 0, jobbra — 1, helyben — 2 
Ekkor az M Turing-gép leírása, kódja legyen: 

gíétátgnzéz amég méz; fém te . . . Ego TÉT e TER TETTEM, EE RÉ, 


ahol a megfelelő számokat binárisan írjuk le, továbbá ő értékeit (mindazokon a 
helyeken, ahol ő érteimezett) a következőképpen soroljuk fel: 

a ölgi, 2) — (ai, zi, mi) tény kódja astéas baját zsé; 
Itt az, af állapotok, z;, zi szalagjelek kódjai, mi; pedig fejmozgást jelöl. Feltehető 
az is (pl. az fé — 1I, 0 — 00, 1 — 01 átírással). hogy M leírása egy I"-beli 
(I — (0,1p) szó. A kódolás lényeges vonásait így összegezhetjük: 

Minden szóba jövő M gépet egy w € I" szóval írunk te. Tetszőleges w E DP 
szóhoz legfeljebb egy gép van — ennek jele tegyen M., -, amelynek a kódja w. Az M 
ismeretében a w kód algoritmussal kiszámítható. A w leírás ismeretében pedig az 
M. gép jellemzői (állapotai, átmenetfüggvénye, stb.) algoritmussal megkaphatók. 


A következő tételben pontosan megfogalmazzuk, hogy mit értünk univerzátis 
Turing-gép alatt, és vázlatosan meg is adunk egyet. Figyelemre méltó a konstruk- 
ció analógiája a számítógépes programozási gyakorlatból ismert interpreterekkel 
(mint pl. a BASIC nyelv interpreterei). 


Tétel: Van olvan 3-szalagos U Turing-gép. amelyre teljesül a következő: ha 
w,s € I", és Mu, létezik, akkor az U gép a wits bemenetet pontosan akkor fo- 
gadja el (utasítja el, kerül vele végtelen ciklusba). ha Mu az s bemenetet elfogadja 
(elutasítja, végtelen ciklusba kerül vele). 
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Bizonyítás: Csak vázoljuk az U gép szerkezetét. A nem különösebben érdekes 
részleteket mellőzzük. Az U első szalagja a wzés inputot tartalmazza, és csupán 
a w értelmezgetésére (lényegében az M., átmenetfüggvényét leíró táblázatnak a 
böngészésére) szolgál. Az U gép második szalagja M. egyetlen szalagjának fe- 
lel meg. Tartalma és a fej helyzete az U működése során mindig azonos az M., 
éppen szimulált lépésekor tapasztalható szalagtartalommal, illetve fejpozícióval. 
U harmadik szalagja az M.,-nek a szimulált helyzetben érvényes belső állapotát 
(pontosabban annak leírását) tartalmazza. 


U a szimuláció tényleges megkezdése előtt egy kis előkészítő munkát végez. 
Először ellenőrzi, hogy My létezik-e. Ha nem, akkor itt megáll elutasító állapot- 
ban. Ellenkező esetben átmásolja az s inputot a második szalagjára, és a harmadik 
szalagra a kezdőállapot kódját jegyzi fel. Az előkészítő munka után U szalagjai 
így festenek: 





Az U az M,, gép egy lépését több lépésben szimulálja a következők szerint; 
a w leírás alapján meghatározza, hogy M., mit lépne, ha U második szalagján 
a fej alatt található jelet a harmadik szalagon ábrázolt belső állapotban látja, Ha 
mondjuk a szalagjel a, az állapot pedig g. akkor w-ből a ő(g, a) leírását kell értel- 
meznie. Ennek ismeretében meglépi M., lépését: ennek megfelelően módosítja a 
második és harmadik szalagot. Könnyen látható, hogy egy ilyen szimulációs lépés 
tényleg megvalósítható Turing-géppel. U szalagjai közvetlenül az Mw gép i-edik 
lépésének szimulációja után így néznek ki: 








wzés 
M. szalagja az i-edik lépés után 
My belső állapota az i-edik lépés után 




















U akkor áll meg. ha Mw megáll. Ez esetben pontosan akkor fogadja el a wjés 
bemenetét, ha a megállás után az M,, elfogadó állapotának kódja van az utolsó 
szalagon. Mindezekből könnyen látható, hogy az itt körvonalazott U megfelel a 
tétel követelményeinek. O 
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7.6. Alapvető kiszámíthatatlansági tételek 


Ha nem vagyok itt, a Hörpentőben keressen. Ha nem vagyok 
a Hörpentőben, akkor itt vagyok. Kivétel Violin, a fülrepesztő 
zenész. Ő, ha itt vagyok, keressen a Hörpentőben, ha meg a 
Hörpentőben vagyok, itt keressen. LÁZÁR ERVIN 
(A Sróf mester ajtaján levő felirat 
Berzsián és Dideki történetéből.) 





Most már megvannak az eszközeink, amelyekkel a kiszámíthatóság korlátaira 
vonatkozó első klasszikus eredményeket igazolni tudjuk. Megmutatjuk, hogy nem 
minden nyelv rekurzíve felsorolható; továbbá, hogy nem minden rekurzíve felso- 
rolható nyelv rekurzív. Érvényesek tehát a következő szigorú tartalmazási relációk 
eF jelöli az összes / feletti nyelvből álló halmazt): 


RcREc2". 


A nyelvek definíciójában továbbra is az előző részben szereplő Turing-gépekre 
fogunk szorítkozni. Ezek egyszalagosak. az input abc-jük (0, 1), és egyetlen elfo- 
gadó állapotuk van. Építeni fogunk az univerzális gép tárgyalásakor ismertetett 
kódolásra is. 


7.6.1. A diagonális nyelv — egy nem rekurzíve felsorolható nyelv 


Mint már láttuk, létezik nem rekurzíve felsorolható nyelv. Egy ilyen L" nyelv léte- 
zését a Cantor-féle diagonális eljárással mutattuk ki. Itt egy másik ilyen konstruk- 
ciót ismertetünk, amit Cantor ötletének közvetlenebb alkalmazásával nyerünk. 

Tekintsük azon Turing-gépeket, amelyek nem fogadják el a saját kódjukat. Te- 
gyük fel, hogy az ezen gépek kódjaiból álló L4 nyelv rekurzíve felsorolható, azaz 
létezik olyan M Turing-gép, amely éppen ezt a nyelvet ismeri fel, A felismert 
nyelv fogalmából tudjuk, hogy M akkor és csak akkor ismeri fel egy N gép kód- 
ját, ha N kódja benne van a nyelvben. Másrészt a nyelvet éppen úgy adtuk meg. 
hogy az N kódja pontosan akkor van benne, ha N nem ismeri fel a saját kódját. 
A két állítást az M — N speciális esetre összerakva azt kapnánk, hogy M akkor 
és csak akkor ísmeri fel a saját kódját, ha nem ismeri fel a saját , ami képte- 
lenség. Tehát az La nyelv nem lehet rekurzíve felsorolható. Nézzük ezt egy kícsit 
pontosabban! Az La diagonális nyelv a következő: 








La— (well; az M,, gép létezik, és w £ Lm. )- 


Tétel: La nem rekurzíve felsorolható. 
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Bizonyítás: Indirekt érvelve tegyük fel, hogy a diagonális nyelv rekurzíve felso- 
rolható. Ez annyit tesz, hogy van olyan M Turing-gép, amelyre Lg — Lm. Nézzük 
most ennek az M gépnek a w € I" kódját, másként mondva azt a szót, amellyel 
M - Md fennáll. Az Lg nyelv és a w szó viszonyát illetően két lehetőség van: 
vagy w € La. vagy pedig w £ La. Megmutatjuk, hogy mindkét feltevés ellent- 
mondáshoz vezet, igazolva ezzel a tételt. 

Ha w € La, akkor La definíciója szerint w € Lm: De az utóbbi nyelv éppen 
La, tehát w € La, ami ellentmond kiinduló feltevésünknek. 

Ha pedig abból indulunk ki, hogy w £ La, akkor Lg definíciója szerint w € 
Lm. hiszen My létezik. Újfent használva az Lg — Lm. egyenlőséget azt kapjuk, 
hogy w € La, ami ismét képtelenség. A bizonyítás ezzel teljes, 5 


7.6.2. Az univerzális nyelv - egy rekurzíve felsorolható, de nem re- 
kurzív nyelv 


A következő algorítmikus kérdés is gépekkel! foglalkozik: adott egy M gép és 
egy s € I" szó; döntsük el, hogy M elfogadja-e $-et. Első megoldási kísérletünk 
az lehetne, hogy futtatjuk M-et, és megnézzük, mi történik. Ez megy ís akkor. 
ha a kérdésre a válasz igenlő, azaz s € Lm. Véges sok lépés után megtudjuk a 
választ, Ha viszont s végtelen ciklust eredményez, akkor bajban vagyunk. A gép 
csak megy és megy, és mi nem tudjuk, hogy tényleg végtelen ciklusban van-e, vagy 
csak egyszerűen egy sokáig tartó véges számítással van dolgunk. 

Alaposabban megnézve a kérdést arra jutunk, hogy az algorítmusnak, amit 
keresünk, valamiféle szuperalgoritmusnak kellene lennie, Olyannak, ami minden 
gépnél okosabb, hiszen mindent tud, amit a többiek, Mindjárt kiderül, hogy ilyen 
módszer nincs. A problémának —- ami egy eldöntendő kérdés - megfelelő nyelv 
La. az univerzális nyelv: 


LIL. 7 (wise It; az Mu gép létezik, és s € Lm, )- 


Az univerzális nyelv tehát azon (kód.input szó) párokból áll, melyekre a kóddal 
leírt Turing-gép felismeri az ill nput szót. Az elnevezés azon az egyszerű ész- 
revételen alapszik, hogy ez a nyelv éppen az wniverzális Turing-gépek nyelve: pon- 
tosan azokból a szavakból áll, anelyeket egy univerzális gép elfogad. Tömören ezt 
úgy írhatjuk, hogy Lu — Lu. ahol U tetszőleges univerzális gép. Innen azonnal 
látjuk, hogy L4 rekurzíve felsorolható. 

Meg fogjuk mutatni másfelől, hogy Lu nem rekurzív. Ha volna egy mindig 
megálló M algoritmus, ami L4-t felismerné, akkor szerkeszteni tudnánk egy másik 
— az M eljárást , hívó" — módszert, ami felismerné a diagonális nyelvet. Ez pedig 
lehetetlen, hiszen La-ről láttuk, hogy nem rekurzíve felsorolható. Érvényes tehát a 
következő: 
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Tétel (A. Turing, 1936): L. egy rekurzíve felsorolható, de nem rekurzív nyelv. 
Bizonyítás: L.,-t éppen az univerzális Turing-gépek ismerik fel, tehát L., rekurzíve 
felsorolható. 


Tegyük fel ezután indirekte, hogy Lu rekurzív; legyen M egy mindig megálló 
Turing-gép, ami felismeri D-t. Legyen M" az a Turing-gép, amelynek működését 


az alábbi folyamatábra mutatja: 


Mig létezik? 










3 les 
pro p 











Az M! gép a w € I" bemenettel elindítva a következő fő lépéseket végzi: 
(1) Ellenőrzi, hogy M4 létezik-e. Ha nem, akkor elutasító állapotban megáll. 
(2) Ellenkező esetben, ha M., létezik. akkor elindítja M-et a wjkw inputtal. Ha M 
elfogadó állapotban áll meg, akkor M" elutasító állapotban végez, ha M elutasító 
állapotban álit meg, akkor elfogadja a w bemenetet. 

Az M" gép mindig megáll, mert az (1) lépés tesztje algoritmussal megvaló- 
sítható, és M mindig megáll. Világos továbbá, hogy M" pontosan akkor fogadja 
el w-t, ha M. létezik és w d Lm.,. Más szóval M" éppen az La nyelvet fogadja 
el. Ez pedig képtelenség, hiszen £g nem rekurzíve felsorolható, és ezért nem lehet 
egyetlen gép nyelve sem. M fétezését feltételezve ellentmondást kaptunk, igazolva 
ezzel, hogy 24 nem rekurzív. DJ 


7.7. . Összefüggések a kiszámíthatósági fogalmak között 


Az eddig vett kiszámíthatósági fogalmak közötti viszonyokkal foglalkozunk a kö- 
vetkezőkben. Először a rekurzíve felsorolható és a rekurzív nyelvek közötti kap- 
csolatot vesszük szemügyre, majd a függvények számításának és a nyelvek felis- 
wmerésének feladatait vetjük össze. 
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7.71. Rekurzivitás és rekurzíve felsorolhatóság 


A nyelvfelismerési feladatokról megállapítottuk, hogy igen-nem problémáknak 
felelnek meg. Valamely P tulajdonsággal rendelkező szavak halmazát kell felis- 
merni. A nyelvbe azok a szavak tartoznak, melyekre P igaz. Érdekes szerepe van 
itt a P tulajdonság —P tagadásának. A —P pontosan akkor teljesül egy s € IF 
szóra, ha P nem teljesül s-re. Ezért, ha a P igenpéldányaiból álló nyelv L, akkor 
a -P igenpéldányaiból álló nyelv az L komplementere; TM E. Ha van egy mindig 
megálló M algorítmusunk a P eldöntésére, azaz L felismerésére, akkor a -P tu- 
lajdonságot is el tudjuk dönteni. Csupán az M elfogadó és elutasító állapotait kell 
felcserélni. Az így kapott M" gép az I" ML nyelvet ismeri fel. 

Ha csak egy fél algoritmusunk van, azaz FL — Lm, de M nem áll meg minden 
bemeneten, akkor az állapotok felcserélésével nem érünk sokat. Az olyan s € I" 
bemenetekre, amelyekre M nem áll meg, sosem tudjuk meg a választ véges sok lé- 
pés után. Ha viszont a P és a -—P eldöntésére is van egy-egy fél algoritmusunk, ak- 
kor ezek összerakhatók egy egésszé. A két gépet párhuzamosan működtetve véges 
időben megkapjuk a választ minden bemenetre. Ezeket az észrevételeket pontosan 
is megfogalmazzuk. Bevezetünk előbb egy fogalmat, amit a bonyolultságelméleti 
fejezetben is használni fogunk. 

A nyelvekből álló halmazokat (2" részhalmazait) nyelvosztályoknak nevez- 
zük. Nyelvosztályokra eddigi példáink R, RE, 27 . Legyen X C 2" egy nyelv- 
osztály. Ekkor a komplementer nyelvosztály, co X az X-beli nyelvek komplemen- 
tereiből ált: 

c0X-(LCP: PNLEX) 


Az így értelmezett komplementerképzés fontos sajátja, hogy megőrzi a nyelvosz- 
tályok közötti tartatmazási viszonyokat: 


XcYc2 — coX CcoY. 


Ugyanis ha L € coX, akkor definíció szerint I" XL € X. Az X GY tartalma- 
zás miatt I YL € Y, amiből pedig L € coY. Szintén egyszerűen igazolható a 
tetszőleges X nyelvosztályra érvényes co(coX) — X összefüggés. 

A bevezetett jelöléssel a következőképpen fogalmazhatjuk meg észrevételein- 
ket: 


Tétel: 
(DR z-coR 
(2. R—-RENcoRE 


Bizonyítás: (1) Tegyük fel, hogy L € R. Legyen ennek megfelelően M egy 
Turing-gép, mely minden inputon megáll és az £ nyelvet fogadja el. Az M elfo- 
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gadó és elutasítva megálló állapotainak felcserélésével olyan gépet nyerünk, ame. 
lyik éppen az L komplementerét, az I" ML nyelvet ismeri fel. Nyilván az új gép is 
mindig megáll, tehát IT" ML is rekurzív. Beláttuk ezzel, hogy coR C R. A fordított 
irányú tartalmazás innen már adódik a co-operátorra megismert szabályokból: 


R — co(cog] CcoR. 







(2) A nyilvánvaló R C RE egyenlőtlenségből komplementerképzéssel nyerj 
hogy R — coRg C coR€, így összességében R C RE NncoR€. A fordított irá. 
nyú tartalmazás igazolásához tegyük fel, hogy L € REN coR€. Legyen ennek 
megfelelően MI, illetve Mo két Turing-gép, melyek az L, illetve az I" Y.£ nyel. 
vet ismerik fel. Ezekből egy mindig megálló M3z algoritmus szerkeszthető, melye 
LIL - Lm 

Legyen s € I" a bemenő szó. Az M; gépet szemléletesen úgy képzelhetjük el, 
hogy az Mi és Ma gépek egymás mellett, egymástól függetlenül párhuzamosan 
dolgoznak ugyanazzal az s inputtal: 


Mi 














Ma 











Ma 











Az M3 pontosan akkor álljon meg, ha Mi és M2 valamelyike megáll. Ms 
akkor fogad el, ha a megállás Mi elfogadó, vagy pedig M2 elutasító állapotában 
történt. Világos, hogy az M3z az L nyelvet ismeri fel. Az ís igaz, hogy mindig 
megáll, hiszen ha s € L, akkor Mi, ha pedíg s € L, akkor M2 fog biztosan 
megállni véges sok lépés után. 

M3 megval, ató párhuzamosság nélkül is. A megfelelő Turing-gép szalag- 
jai egy részén végzi az My munká egy ettől diszjunkt másik részén pedig az 
M teendőit. M3 felváltva szimulátja a két gép lépéseit: a 24 — 1-edik lépésben az 
M i-edik, a 2i-edik lépésben pedig az M? i-edik lépését teszi meg. Ezáltal, ha va- 
lamelyik gép megáll a k-adik lépésében, akkor M3 is megáll, legkésőbb a 2k-adik 
lépésben. 

Beláttuk tehát, hogy L rekurzív nyelv, vagyis R 2 REN coR€. A másik 
tartalmazással együtt ez bizonyítja a (2) állítást.D 
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Feladat: Az előző érvelésben az Mi és Ma párhuzamos futását úgy alakítottuk 
sorossá, hogy felváltva léptettük őket. Milyen más módokon fésülhetők össze a 
két gép lépései úgy, hogy a bizonyítás továbbra is működjön? 


A tételt olyan állításnak tekinthetjük, amely a nyelvosztályainknak a komple- 
menter műveletre való zártságával foglalkozik. Kiderül, hogy a rekurzív nyelvek 
összessége zárt a komplementer képzésére — azaz L € R esetén TNLERis 
igaz -, míg a rekurzíve felsorolható nyelvekre ez nem teljesül. A következő feladat 
az unió- és a metszetképzés műveleteire való zártságról szól, 





Feladat: Tegyük fel, hogy az Li és La nyelvek rekurzíve felsorolhatók (rekur- 
zívek). Igazoljuk, hogy Lin Lo és Ia UJ La ís rekurzíve felsorolható (rekurzív). 
(Az előző tételben látottakhoz hasonlóan működtessük párhuzamosan az L4 és La 
nyelveket felismerő Mi és M2 gépeket.) 


7.72. Függvények és halmazok (nyelvek) 


A Turing-gépeknek kétféle működési módjával ismerkedtünk meg. Az egyik a 
nyelvek felismerése, a másik pedig a függvények számítása. Az előbbinél a vá- 
lasz egyetlen bittel ábrázolható (elfogadás vagy annak a hiánya), a másodiknál 
hosszabb is lehet az eredmény. Ebben az értelemben a függvények számítása ál- 
talánosabb feladat, mint a nyelvek felismerése. Az általános és a speciális közötti 
összefüggések szinte mindig érdekesek, Itt a kiszámíthatóság szempontjából vet- 
jük össze a két fogalmat. Később — a kisebb bonyolultságú feladatok tanulmányo- 
zásakor - újra előkerül majd a kétféle működés közötti viszony, 

A kiszámíthatóság nézőpontjából a rekurzíve felsorolható nyelvek a parciá- 
lisan rekurzív függvényekkel, míg a rekurzív nyelvek a rekurzív függvényekkel 
hozhatók természetes kapcsolatba, Ezeket fogalmazza meg a következő két tétel. 





Tétel: Az L C I nyelv akkor és csak akkor rekurzíve felsorolható, ha van olvan 
f: Doc P parciálisan rekurzív függvény, melynek értékkészlete éppen az L 
nyelv (szokásos jelöléssel Im(f) — L). 


Bizonyítás: — : Tegyük fel, hogy L rekurzíve felsorolható. Ennek megfelelően van 
olyan M Turing-gép, melyre L — Lw. Legyen ezután M" olyan Turing-gép, mely 
kezdetben az s € I" bemenő szót felmásolja az output szalagjára, azután pedig 
lépésről lépésre szimulálja az M gépet. Az egyetlen kivétel, hogy ha M elutasító 
állapotban áll meg, akkor M" végtelen ciklusba esik. Az M" gép tehát kizárólag 
az s € L szavakra áll meg; megálláskor s lesz az output szalagon. Az M" által 
kiszámított fm" függvény értékkészlete ezért éppen L. 


214 7. TURING-GÉPEK 


s: Tegyük fel, hogy f egy parciálisan rekurzív függvény, mondjuk f — fa, 
ahol M egy Turing-gép. Tekintsük az F" szavainak wa, . . . , n . . . kanonikus fel. 
sorolását (a rendezés hosszúság szerint növekvően, azonos hosszúak között lexiko- 
grafikusan). Használni fogjuk még a természetes számokból álló párok egy felso- 
rolását ís. A következő ábrán látható táblázaton megyünk végig a délnyugati irányú 
átlók mentén. A sorozat eleje így alakult: (0,0), (0, 1), (1,0), (0,2),(1,1), (2,0), 
stb. 





A felsorolások két tulajdonsága lesz fontos a számunkra, Egyrészt mindkettő meg- 
valósítható algoritmussal. A sorozatok adott elemének az ismeretében a következő 
elem számítással meghatározható. A másik lényeges vonásuk, hogy mindkét fel- 
sorolás kimerítő; mindegyik szóra, illetve párra sor kerül valamikor. 

Az M" Turing-gép a teendőit az (i, j) párok sorozatához kapcsolódóan, a s0- 
rozat mentén haladva végzi. Tegyük fel, hogy s € Tt az M! bemenete. Az (ij) 
párhoz kapcsolódóan M" a következőket teszi: szimulálja az M eiső § i lépését a 
1wj szón. Ha ezalatt M megáll és o outputot produkál, akkor ellenőrzi, hogy s — 0 
teljesül-e. Ha igen, akkor M" megáll és elfogadja $-et. Minden más esetben (M 
nem áll meg i lépésen belül, vagy megálláskor az eredmény nem 5) a felsorolás 
szerint következő párral folytatja a munkát, Ha ez (i, j") akkor M első í lépését 
teszi meg a wyr szóval, stb. 

Mi lesz az M" gép Lm nyelve? Világos, hogy Lm C Imí(f), hiszen M" csak 
olyan s szót fogad el, ami megkapható mint M egy számításának az eredménye. 
Fordítva, tegyük fel, hogy s € Im(f). Van tehát egy olyan j. hogy s — fm(wj) 
Tegyük fel, hogy M a wz bemeneten í lépésben kapja meg az s eredményt. Ekkor 
M" — ha előbb nem - az (i, j) pár feldolgozásakor elfogadja s-et. Ezzel igazoltuk 
az Lm 2 Im(f) tartalmazást is. Igaz tehát, hogy Lm — Im(f). DC 





A bizonyítás második felének ötletét felhasználva tetszőleges rekurzíve felso- 
rolható L nyelvhez szerkeszthető olyan algoritmus, ami éppen az L nyelv szavait 
sorolja fel valamilyen sorrendben. Innen ered a rekurzíve felsorotható kifejezés. 
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A rekurzivitásra vonatkozó tétel kimondása előtt emlékeztetünk egy hasznos 
fogalomra. Az egyszerűség kedvéért feltesszük, hogy 0,1 € I. Egy L C I" nyelv 
karakterisztikus fiigyvénye, XL a következő: 





(5) — leI, haseEL 
MÁAS)Z 0er, hasgLk 


Tétel: Az LG I" nyelv pontosan akkor rekurzív, ha xr egy rekurzív függvény. 


Bizonyítás: —: Tegyük fel, hogy L rekurzív: M olyan Turing-gép, mely L-et 
ismeri fel, és minden inputra megáll. Legyen ezután M" olyan Turing-gép, mely 
szimulálja M-et, majd 1-et vagy 0-t ír az output szalagjára, annak megfelelően, 
hogy M elfogadó vagy elutasító állapotban állit meg. Világos, hogy M" éppen az 
L karakterisztikus függvényét számolja ki. 

a: Tegyük fel, hogy xz rekurzív függvény, és ennek megfelelően az M 
Turing-gép a xz függvényt számítja ki. Legyen M" egy olyan Turing-gép, mely 
lépésről lépésre szimulálja M-et: végül elfogadó, illetve elutasító állapotban áll 
meg aszerint, hogy M output szalagján 1, vagy 0 a végeredmény. Ez az M" gép 
pontosan az L nyelvet ismeri fel. O 


7.8. További eldönthetetlen problémák 


Visszatérünk az algoritmussal nem megoldható feladatokhoz. Az ember először 
hajlamos ezeket afféle patologikus eseteknek tekinteni, amelyek nem mondanak 
sokat a természetesen felmerülő problémák iránt érdeklődőknek. Szeretnénk né- 
hány példával érzékeltetni, hogy ez távolról sem igaz: ilyen reménytelenül nehéz 
problémákkal a legkülönbözőbb területeken is találkozhatunk. Egy meghatározás- 
sal kezdjük, amellyel nem új fogalmat, hanem inkább egy új elnevezést rögzítünk. 


Definíció (eldönthetetlen nyelv): Az L € I" nyelvet eldönthetetlen nyelvnek ne- 
vezzíik, ha L nem rekurzív. 


A szóhasználat azt takarja, hogy az L nyelvbe tartozásínem-tartozás problémá- 
ját nem lehet algoritmussal eldönteni: nincs olyan algoritmus, mely véges lépés- 
ben meg tudná mondani, hogy egy adott szó benne van-e a nyelvben. Turing tétele 
Szerint az a probléma, hogy egy Turing-gép egy adott inputot elfogad-e, algoritmi- 
kusan eldönthetetlen. Itt további példákat adunk eldönthetetlen problémákra. Az 
igazán érdekesek azok lesznek, amelyek a Turing-gépek formalizmusától függet- 
lenül, természetesen megfogalmazhatók, 
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7.8.I. A Megállási probléma (Halting problem) 


Egy program tesztelésekor fontos kérdés, hogy nincs-e benne végtelen ciklus. Jó 
lenne hatékony módszert találni ennek az eldöntésére. Legyünk szerényebbek: néz. 
zük csak azt ez egyszerűbb kérdést, hogy egy adott program egy rögzített beme- 
nettel megáll-e véges sok lépés után, Még ez az ártatlannak tűnő kérdés is eldönt- 
hetetlen? . 

A Megállási probléma kérdése az, hogy égy (a kódjával adott) Turing-gép adott 
bemenettel egyáltalán megáll-e. A problémához tartozó En nyelv a következő: 


In 7 frotés er 





az My gép létezik, és az s bemenettel 
elindítva véges sok lépésben megáll 


Az Lh nyelv nyilván tartalmazza az Lu univerzális nyelvet, A következő tétel gon- 
dolatmenete tulajdonképpen a két nyelv közötti algoritmikus kapcsolaton alapul. 


Tétel: LE REVR. 


Bizonyítás: Lényegében az univerzális Turing-gép mutatja, hogy La € RE. Csak 
annyi módosítás szükséges. hogy megálláskor a gép mindig menjen át elfogadó 
állapotba. Az így megbütykölt gép pontosan akkor fogadja el a wzts bemenetet, 
ha ezzel U megáll, azaz ha wjés € Ln. 

Az állítás fennmaradó részének igazolásához tegyük fel indirekte, hogy La 
rekurzív. Eszerint van olyan M Turing-gép, ami La-t ismeri fel, és mindig megáll 
Legyen ekkor M" az a Turing-gép, mely a wzés inputon először az M gépet futtatja 
le. Ha M elutasítja a bemenetét, akkor M" álljon meg elutasító állapotban. Ha M 
elfogadó állapotban áll meg, akkor M" szimulálja az U univerzális Turing-gépet a 
wzjés bemeneten, beleértve az elfogadást/elutasít; 








edés ef U ságen 





























nem nem 


"tt komoly szerephez jut az a tény, hogy Turing-gépek szalagja végtelen. Ha - az igazi szá- 
míitógépekhez hasonlóan — csak véges méretű 4 engedünk meg, akkor a feladat megoldhatóvá 
válik. A következő fejezetben a tár-idő-tételben adunk egy módszert a tárkorlátos végtelen ciklusok 
felismerésére. Ez azonban a tesztelés szemszögéből csak elvi jelentőségű; nem ismert gyakorlati 
szempontból elfogadható megoldás a feladatra. 
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Az M-re tett feltevés miatt M" mindig megáll. Nyilvánvaló ezen felül, hogy 
M" éppen az L.,, univerzális nyelvet ismeri fel. Mindezek ellentmondanak annak, 
hogy Lua eldönthetetlen (Turing tétele). 2 


Valamivel több is mondható: a Megállási probléma akkor is algoritmikusan 
eldönthetetlen marad, ha az Mu gépet csupán az üres inputtal futtatjuk. Legyen 


L.—-(werT : M,, létezik és az e (üres) inputon megáll). 


Tétel (A. Church, 1936): 
L.ERENR. 





Bizonyítás: Az L, nyelv rekurzíve felsorolhatósága így látható: a w € !" inputból 
elkészítjük a wie — wzl szót, majd ezzel a bemenettel lefuttatjuk az Ly megállási 
nyelvet felismerő gépet. Az így adódó algoritmus pontosan az Le nyelvet ismeri 
fel. 

AzL. 8 R állítás igazolására megmutatjuk. hogy az általános Megállási prob- 
léma visszavezethető erre a speciális esetre: egy M Turing-gépnek az s bemeneten 
való működése szimulálható egy olyan (az Af-től és az s szótól egyaránt függő) 
Turing-géppel, amely üres input esetén felmásolja az s szót az input szalagjára, 
majd M működését lépésről lépésre utánozza. Ha tehát az L, nyelv eldönthető 
volna, akkor az általános MegálMtási feladat is eldönthető lenne. CG 


7.8.2.  Hilbert 10. problémája 


... ennek Ősi és rű íze van, mint talán 
az Ezeregyéjszakának... 


JORGE LUIS BORGES: Embér a küszöbön 





1900-ban Párizsban a világ matematikusainak kongresszusán David Hilbert egy 
azóta legendás hírűvé vált előadást tartott. Ebben a jövő fontos kutatási irányait 
Próbálta meg kijelölni. Huszonhárom olyan kérdést fogalmazott meg, melyekről 
úgy vélte, hogy a megválaszolásuk lényeges előrelépést jelentene. Kifejezte azt 
hogy a kérdések nehezek, és a XX. század nem lesz elég a 
megoldásukhoz. A két jóslat közül az utóbbi vált be kevésbé. A kérdések jó részét 
mára megoldották, és mindegyikkel kapcsolatban komoly eredmények születtek. A 
Problémák jelentőségét illetően nem tévedett: óriási hatást gyakoroltak a tudomány 
fejlődésére. Nem kivétel ez alól a tizedik kérdés sem. 

A tizedik problémában Hilbert célul tűzte ki. hogy adjunk általános mód- 
szert diofantikus egyenletek megoldhatóságának eldöntésére. A probléma pontos 
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megfogalmazásához szükségünk lesz egy fogalomra. Egész egvütthatós polino. 

mon egy olyan kifejezé: ünk, amely változókból és egész számokból építhető 

fel az összeadás, kivonás és szorzás műveleteivel. Eszerint az xy? — 5zu kifeje. 

Zés tekinthető az x,y, z, u változók egy egész együtthatós polinomjának. Jelölje 

ZIzr1,. . . , tm) azon egész együtthatós polinomok öss. ességét, melyekben a válto- 

zók xi, 22, . . . , "m közül kerülnek ki; például z3y? — 5zu € ZÍz,y, z, ul. 
Tetszőleges f(z1, . . . fm) € ZÍza, - . . , cm) polinom felírható 


















nm 


ni 
f(x... .Tm)— E sül E; Aia.d EVT ett Em 


8170 í550 


alakban, ahol n1,... nm € ZT és az a; ;,, együtthatók pedig egész számok. 
Erről könnyen meggyőződhetünk, ha az f-et megadó kifejezésben felbontjuk a 
zárójeleket, Az f polinom foka az előző felírásban előforduló legnagyobb kítevő- 
összeg: 

degf — maxfi1 b... 4 ím ] di1..im 7 04 
Az 


69) f(x... tm) 50 


alakú egyenleteket diofantikus egyentereknek nevezzük, ahol f(xi,..., tm) 
egész együtthatós polinom. A (x) diofantikus egyenlet megoldásán egy olyan 
(t1,..., Um) E Z" egészekből álló m-est értünk, melyre f(zi, . . . tm) — 0. 
A diofantikus egyenletet megoldhatónak nevezzük, ha van ilyen értelemben vett 
megoldása. A diofantikus egyenletek megoldhatóságának vizsgálata, megoldásaik 
keresése szinte a szám fogalmának létezése óta művelt. rendkívül gazdag terület. 
Ilyen egyenlet (pozitív) megoldásaiként adhatók meg például a pitagoraszi szám- 
hármasok: azok a természetes számokból álló (z, y, 2) hármasok, melyek egy de- 
rékszögű háromszög oldalai lehetnek: 





744 z 0. 

Hilbert tizedik kérdése így fogalmazható: adjunk egy olvan véges sok lépésből 
álló eljárást, mely tetszőleges egész együtthatós f polinomra eldönti, hogy az f- 
nek megfelelő (x) egyenlet megoldható-e. 

Úgy tűnik, Hilbert a problémát abban a meggyőződésében tette közzé, hogy 
minden értelmesen megfogalmazott számítási problémára van algoritmus. Ezt a 
harmincas években Kurt Gödel, Alonzo Church és Alan Turing munkássága ala- 
posan megcáfolta. Mint láttuk, vannak olyan feladatok, amelyekre nem létezik 
megoldó algoritmus. Ezek után már természetesen merült fel a lehetőség, hogy 
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a tizedik probléma feladata is egy ilyen kemény dió. Ebbe az irányba mutatott az a 
régen megfigyelt tény ís, hogy a diofantikus egyenleteknek központi szerepük van 
a matematikai hátterű algoritmikus kérdésekben: sok fontos igen-nem problémát 
át tudtak fogalmazni diofantikus egyenlet megoldhatóságává. 

A tizedik probléma sokáig ellenállt a kutatók ostromának, míg végül Mar- 
tín Davis, Julia Robinson és mások munkáira építve 1970-ben Jurij Matijasze- 
vics megmutatta, hogy nem létezik olyan algoritmus, ami a (x) alakú egyenletek 
megoldhatóságát eldöntené. A tizedik problémában megfogalmazott algoritmikus 
kérdés eldönthetetlen. 

A nevezetes eredmény ismertetése kényelmesebb lesz, ha nyelvek helyett ter- 
mészetes számok halmazaival foglalkozunk. A kanonikus felsorolás kölcsönösen 
egyértelmű megfeleltetést létesít (0, 1)" szavai és a természetes számok között: a 
s € (0,1)" szónak azon i index felel meg, melyre s — tw;. Ezzel egyszersmind 
kölcsönösen egyértelmű megfeleltetést kapunk a természetes számok részhalmazai 
és az LC (0,1)" nyelvek között. E megfeleltetés révén beszélhetünk arról, hogy 
egy H C Zt számhalmaz rekurzív, illetve rekurzíve felsorolható. Ez egyszerűen 
azt jelenti, hogy a H-beli sorszámokkal azonosított szavak halmaza rekuizív, il- 
letve rekurzíve felsorolható. 

Legyen m 2 0 és f(x, T2,.... tm.) € Zízi,T2,..., Tmvy] egy egész 
együtthatós m -- 1-változós polinom és legyen 








H fe ezt vannak olyan u, u2, . . . , Um természetes számok, ) 
$ána fú 


hogy f(t1, 2)... tmV) 50 





Definíció: A HC Z? halmaz diofantikus hatmaz, ha van olyan f polinom, hogy 
H-H. 


A diofantikus halmaz fogalma mögött egy számítási modell húzódik meg, ami 
első látásra bizarrnak és szárnyaszegettnek tűnik. Ebben az f polinom jelenti a 
Programot. A v € Zt számot a program akkor fogadja el, ha vannak olyan ui 
természetes számok, hogy f(uj, u2, . . . , tm, v) — 0. Az rögvest látszik, hogy ez a 
furcsán értelmezett számítás megvalósítható Turing-géppel: az adott v bemenethez 
Sorra vesszük az (u1, u2, . . . um) € (Zt)" vektorokat; az (u, 2, . . . , um) vek- 
tor kapcsán kiszámítjuk az f(u1, 12, . . . , um 0) helyettesítési értéket. Ha ez nulla, 
akkor elfogadjuk v-t, ha nem, akkor a következő vektorral próbálkozunk. A vek- 
torok felsorolásával mint számítási feladattal már találkoztunk. Az m — 2 esetre 
adtunk egy módszert. Ez általánosítható tetszőleges m-re: sorra vesszük azokat a 
vektorokat, amelyek komponenseinek összege i, ahol í — 0,1,2,.... Az adott i 
összegű vektorokból véges sok van, ezeket pl. lexikografikus sorrendben vehetjük. 

Az előző fejtegetés szerint a Hy alakú halmazok, vagyis a diofantikus halma- 
zok rekurzíve felsorolhatók. Olyan eljárást adtunk, ami a H elemeit elfogadja és 
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a Hr-en kívüli bemenetekre sosem áll meg. A Matijaszevics által betetőzött erőfe- 
szítések fő eredménye a fordított irányú állítás: 


Tétel (Matijaszevics tétele): Hu egy H C Z? halmaz rekurzíve felsorolható, ak. 
kor diofantikus is. 


im] 

A tétel bizonyításától itt el kell tekintenünk. Ha tehát H C Zt rekurzíve fel. 
sorolható, akkor van olyan f polinom, melyre H — H5. Az f polinom választható 
úgy, hogy m— Mésdeg f £ 4 is teljesüljön. A tétel szerint a polinomokra épülő 
számítási modell felismerőképessége megegyezik a Turing-gépekével, 

Matijaszevics tételéből elég egyszerűen adódik a tizedik probléma eldönt- 
hetetlensége. A bizonyításhoz hasznos lesz a számelmélet következő klasszikus 
gyöngyszeme: 





Tétel (J. L. Lagrange, 1751): Minden nemnegatív egész szám előáll négy egész 
szám négyzetének összegeként. J 


Ezek után megmutatjuk, hogy ha volna algoritmus a diofantikus egyenletek 
megolklhatóságának véges sok lépésben való eldöntésére, akkor az Lp megállási 
nyelv is eldönthető lenne. 


Tétel: A diofantikus egyenletek megoldhatósága algorítmikusan eldönthetetlen. 


Bizonyítás: A megoldható egyenletekből (illetve azok leírásaibób) álló nyelv re- 
kurzíve felsorolható. Ez ismét csak a számokból álló m-esek (ahol m az egyenlet 
változóinak a száma) felsorolásán alapuló próbálgatással adódik. Ha az egyenlet 
megoldható, akkor a szisztematikus behelyettesítgetés előbb-utóbb megoldást ad. 

Azt kell ezután megmutatnunk, hogy nincs olyan algoritmus, amely mindig 
megáll, és éppen a megoldható egyenleteket fogadja el. Tegyük fel indirekte, hogy 
létezik egy ilyen M módszer. 

Legyen H c Zt az Ln nyelvnek megfelelő számhalmaz. Ho rekur- 
zíve felsorolható, ezért Matijaszevics tétele szerint diofantikus is. Van olyan 
f(x... T14,y) polinom, hogy v € Z? éppen akkor tartozik H-ba, ha az 
f(x... Ti4,v) — 0 egyenlet megoldható a nemnegatív egészek körében. (En- 
nek az egyenletnek a változói 21, x2, . . . , 114.) Lagrange tételét figyelembe vévé 
ez egyenértékű azzal, hogy a következő 56 változós egyenlet megoldható-e az egé- 
szek között: 





EN. ÉT EPE 
Pia tala triart SÍ4, 0) 





Jeget bal sz ká tra 82. 
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Az M elj véges sok lépésben eldönti ennek az egyenletnek a megoldhatóságát, 
így a (v € H?) kérdést is; ez pedig ellentmondás, hiszen L4 nem rekurzív, C 


Érintünk még egy érdekes problémakört, ami számhalmazoknak polinomok 
értékeiként való megadásával kapcsolatos, Az utóbbi századokban sokan próbál- 
tak explicit formulákat adni bizonyos nevezetes sorozatokra. Így például meglehe- 
tősen népszerűek voltak a prímszámokat előállító képletek. Egy jellegzetes ilyen 
eredmény Leonhard Euler 1772-ből származó észrevétele, miszerint n? —n-4 41 
prímszám, ha0£n£ 403 

Matijaszevics tételének van egy ilyesforma előállíthatósággal kapcsolatos szép 
következménye, Nevezzük a H GC Zt halmazt explicitnek, ha H előáll! mint egy 
alkalmas egész együtthatós m-változós g € ZIz1, . . . , tm] polinomnak a nemne- 
gatív egész helyeken felvett nemnegatív értékeinek H9 halmaza: 








H-H Í ne 2 





vannak olyan uj , . . . , um természetes számok, 
hogy u — g(ut,..., tm) § 


A definícióból az (ti, tt2, . . . , tm) vektorok felsorolásán alapuló érveléssel azon- 
nal következik, hogy az explicit halmazok rekurzíve felsorolhatók. Matijaszevics 
tételéből egyszerűen adódik, hogy a fordított állítás is igaz. 


Következmény: A rekurzíve felsorolható halmazok explicitek. 


Bizonyítás: Legyen H C ZY egy rekurzíve felsorolható halmaz. Matijaszevics 
tétele szerint alkalmas f(21, 72, . . . , 114, 4) polinommai H — Hp teljesül. Legyen 
ezután a g € ZÍxi, . . . , r1a, y] a következő polinom: 


9(z1... 7144) — (yt 1(1— FÖ(x1, 214 9)) — 1. 


Ha f(u,...,tav) £ 0, és v 2 0, akkor g(ui,...,tt1a,v) a D, Így nem- 
negatív értékeket v 2 0 esetén g csak az f zérushelyeinél vehet fel, Ha pedig 
f(ui,...,u14,v) — 0, akkor gítwi,... 14. v) — (v41(1—0—-15-vAg 
nemnegatív értékei a természetes számokon tehát éppen a Hr elemei. 0 


A prímszámok halmaza rekurzív, hiszen a prímség eldönthető algoritmussal. 
Következésképpen a prímszámok halmaza explicit; ilyen értelemben tehát előállít- 
ható , képlet" segítségével. Ténylegesen meg is adtak ilyen polinomokat, A kiseb- 
bek ezek közül féltenyérnyi helyen leírhatók. Viselkedésük azonban túl bonyolult 








Euler polinomja csúcstartónak számít. Az első 41 természetes számnál mindenütt prím értéket 
vesz fel. mégpedig csupa különbözőt. Az 1 főegyütthatójú másodfokú polinomok között ez a leg- 
hosszabb ilyen sorozat. Ha más főegyüttható is megengedett, akkor valamivel hosszabb sorozatok is 
elérhetők, Példáv) a 362? — 810r 4- 2753 (ún. Ruby-polinom) első 45 értéke prímszám, 
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ahhoz, hogy a gyakorlatban hasznavehetőek legyenek például prímek szisztemati- 
kus előállítására (csúnya, ámde népszerű szakszóval: generálására). 

Az explicit halmazok értelmezésében két helyen is szerepel a nemnegativítás, 
Ezek közül az egyik nem lényeges. 


Feladat: Mutassuk meg, hogy az explicit halmazok definíciójában az u; € Z? fel. 
tétel helyettesíthető a gyengébb u; € Z feltétellet. (Lagrange tétele használható.) 


A definíció másik érdekes eleme, hogy nem a g teljes értékkészlete a H hal. 
maz, csak a nemnegatív u értékek számítanak. Ez a feltétel már nem engedhető el: 


Feladat: Tegyük fel, hogy a g polinom értékei között van két különböző prím- 
szám, p és g. Ekkor van g-nek olyan értéke is, ami pg-val osztható, következés- 
képpen g értékkészlete nem tehet azonos a prímek halmazával. (Tegyük fel, hogy 
9(u,. . . , um) — pés g(vi, . . . , vm) — 9, ahol uz, vz; € Z. Legyen u olyan egész, 
melyre w; z u; (mod p) és w; z vs; . (mod 9). Ekkor g(wa, . . . , wWm) osztható 
pg-val.) 


7.8.3. A Dominóprobléma 


A kirakós játékok nehezek. Aki próbált már mondjuk egy 1500 darabkára gondo- 
san felszabdalt képet összerakni, alighanem egyetért ezzel. Most egy olyan egy- 
szerűen megfogalmazható, kirakó-típusú feladattal ismerkedünk meg, amelynél a 
megoldhatóság reménytelenül nehéz, pontosabban algoritmikusan eldönthetetlen 
problémát jelent. 

Dominén olyan egységnyi élű négyzet alakú lapot értünk, melynek a négy 
élére egy-egy jel van írva. Ezekről a jelekről a kényelem kedvéért feltesszük, hogy 


(0,1)"-beli szavak. 
T 
e. 


A dominó típusát az e jelekből álló rendezett négyes jelenti. Az előző rajz 
dominójának a típusa (a, b, c, d). A dominókat a jól ismert szabály szerint lehet 
egymás mellé rakni: az illeszkedő élek mentén azonos jeleknek kell szerepelni. 
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A dominókat nem szabad forgatni. Az (a, b, c, d) típusú dominót csak úgy te- 
hetjük le, hogy a felső él mentén a legyen. 





a vléla c 


e (ij 














A Dominóprobléma ezek után a következő; Adott dominó-típusok egy véges F 
halmaza; eldöntendő, hogy a sík lefedhető-e hézagtatanul szabályosan illeszkedő 
F-beli típusú dominókkal. Természetesen a fedéshez az egyes típusokból végtelen 
sok példány használható. 

A k típusból álló 7 készlet leírható a következő tagozódású F szóval: 


F:zgzigt...gérrib, 


ahol az x; — az 1 b; r cz r d; szó (az, bi, es, di € (0,1)") az 





aT 
ia bi 
2 











dominó típusának a leírása. 
A Dominéófeladatnak megfelelő D nyelv az alábbi: 


D-(Fc(0,1,x,é)t; asík lefedhető 7-típusú dominókkal ). 


Példa: Az F 5 000110 119810 x11 00 x OL szó a következő két típusból 
álló készlet kódja. 

















10 040 
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Ezzel a készlettel a sík kirakható, másként mondva F € D. A kétféle dominó- 
val a sakktábla fekete és fehér mezőinek váltakozását követő alakzatban parkettáz- 
hatjuk ki a síkot. A megoldáson túl az illeszkedési szabályból adódó kötöttségeket 
is szemlélteti az alábbi - XV. századi portugál padlómozaikról ellesett — minta: 





A Dominóprobléma nem oldható meg algoritmussal. Ezt mondja ki a követ- 
kező tétel. A terjedelmes, de nem különösebben nehéz bizonyítást mellőzzük. 


Tétel; A D nyelv nem rekurzív. C 


Az előző tétel szerint nem lehetséges, hogy D és a komplementere 
(0, 1, e, ÉJT ND is rekurzíve felsorolható legyen. Az utóbbi nyelvről viszont meg- 
mutatjuk, hogy rekurzíve felsorolható. 


Tétel: D € coR€, azaz (0, 1, s," ND € RE. 


A tétel bizonyításában hasznunkra lesz egy nevezetes, ám egyszerű tény. Az 
állítás azzal a kijelentéssel fogalmazható meg szemléletesen, hogy ha az embe- 
riség sohasem hal ki, akkor létezik olyan dinasztia, amely sohasem szakad meg. 
Pontosabban ez így mondható: 





Lemma (König-lemma): Legyen G egy végtelen, gyökeres irányított gráf, amely- 
nek csúcshalmaza a természetes számokkal sorszámozott részekre (szintekre) oszt- 
ható úgy, hogy: 

(0) A nulladik szinten egyedül a gyökér van. Egy csúcsból csak az eggyel nagyobb 
sorszámú szintre mehet él. 

(1) Minden egyes szinten csak véges sok csúcs van. 

(2) Minden — a gyökértől különböző — csúcsnak van őse abban az értelemben, hogy 
fut bele él az eggyel alacsonyabb sorszámú szintről. 

Ekkor a gráfban van végtelen irányított út. 
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0. szint 
1. szint 
2. szint 
3. szint 


4. szin 


Bizonyítás: Nevezzük a gráf y csúcsát az z csúcs leszármazottjának, ha y az x-ből 
elérhető irányított úton. Jelölje ro a gráf gyökerét. A (2) és (0) feltételek miatt a G 
minden csúcsába vezet út xro-ból. Mivel a gráf végtelen, ebből arra jutunk, hogy az 
o gyökérnek végtelen sok leszármazottja van. Ezután indukcióval megadunk egy 
Y0,YI.: Yi . vÉgtelen G-beli utat. Legyen yg — ro. Tegyük fel ezután, hogy 
az yo, yi, - . . , yi csúcsokat már kiválasztottuk úgy, hogy y; a j-edik szintről való, 
és végtelen sok leszármazottja van (0 £ j £ í), továbbá (y5, yj41) éle a gráfnak, 
ha(0 £ j £ i). Ezek a feltételek adják az indukciós feltevést. Ez nyilván teljesül 
17 0-ra. 

Azt kell csak megmutatnunk, hogy a feltéte! az 4.1 alkalmas választásával 
örökíthető í-ről í -- 1-re. Ez pedig egyszerű: legyen 4541 az y; egy olyan gyermeke 
(az y-vel összekötött csúcs az 1-1. szintről), melynek végtelen sok leszármazottja 
van, Az indukciós feltevés szerint y;-nek végtelen sok leszármazottja van. Az (1) 
kikötés miatt viszont csak véges sok gyermeke lehet; van tehát olyan gyermeke is, 
amelynek végtelen sok leszármazottja van. 

Ilyen választással az yo, ya, . . . , Vi41 Sorozatra is ígaz lesz az indukciós felte- 
vés. A sorozat definíciójával tehát sehol sem akadunk el; yo, yi, . . . , yi, : . . tényleg 
egy végtelen út. El 


A tétel bizonyítása: Álljon L C (0, 1, x, 4£)" nyelv azokból a szavakból, amelyek 
kódjai valamilyen dominókészletnek. Világos, hogy L rekurzív: a helyes felépítésű 
leírások mindig megálló algoritmussal felismerhetők. Elég ezek után azt igazolni, 
hogy az LN D nyelv rekurzíve felsorolható. 

Álljon D" azon F dominókésztetek l iból, melyekhez van olyan n, hogy 
Már a 2n x 2n-es négyzet sem rakható ki 7-beli dominókkal. Egyszerű, és mos- 
tanra már bizonyára ismerős érvelés mutatja, hogy D" € RE. Próbáljuk ugyanis 
sorban n — 1,2,...-re 7-beli dominókkal kirakni a 2n x 2n-es négyzetet. Ezt 
adott n-re - ha máshogy nem -— az összes kitöltési lehetőség végignézésével te- 
hetjük meg. Ha van olyan n, melyre a Zn x 2n-es négyzet nem parkettázható ki, 
akkor ezen az úton ez véges sok, bár esetleg csillagászati számú lépés után kiderül. 
Ekkor megállunk elfogadva az 7 készletet leíró F szót. 
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Ezután a tétel igazolásához elegendő belátni, hogy 
EVE a 


Világos, hogy D" GC L) D. hiszen D" dominókészletek leírásaiból áll, továbbá 
D"-beli készletekkel a sík nem rakható ki, hiszen már egy alkalmas négyzet sem 
rakható ki. 

A fordított irányú D" 2 LN D tartalmazás belátásához elég megmutatni, hogy 
ha egy F készlet nincs D"-ban, akkor nincs L ) D-ben sem. Egyszerűbben fogal- 
mazva: ha minden n-re a 2n x 2n-es négyzet lefedhető az 7 készlet dominóival, 
akkor az egész sík is. Ennek igazolására egy gyökeres, végtelen, szintezett grá- 
fot definiálunk. A gráf csúcsai a négyzetek szabályos kitöltéseinek felelnek meg 
a következők szerint. A nulladik szinten van a gráf gyökere: ez felel meg az üres 
négyzet (üres) fedésének. Általában az n-edik szint csúcsai a Zn x 2n-es négy- 
zet szabályos kitöltései F-beli dominókkal. Ezzel megadtuk a gráf csúcsait. A 
2n x 2n-es négyzet egyik kitöltésétől akkor vezet él a 2(n 4 1) x 2(n 4 1)-es 
négyzet valamely kítöltéséhez. ha utóbbinak a középső 2n x 2n-es négyzetét fedő 
része megegyezik az előbbivel. 





gyökér 
































Egyszerű ellenőrizni, hogy a gráf teljesíti a König-lemma feltételeit. A gráf 
azért lesz végtelen, mert tetszőlegesen nagy négyzetek kirakhatók 7-beli domi- 
nókkal. A lemma szerint van ebben a gráfban végtelen irányított út. Ez az út pedig 
az egész sík egy kirakását adja. 0 


7.8.4. Post megfeleltetési problémája 


A következő — Emil Posttól származó — eldönthetetlen probléma is egyfajta ki- 
rakós feladat, de nem geometriai, hanem nyelvészeti jellegű. Azért szólunk róla, 
mert felettébb hajlékony eszközt nyújt a matematikai és számítógépes nyelvészet 
területén egy sereg probléma eldönthetettenségének a bizonyítására. 
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Legyen £ egy véges abc. Post megfeleltetési problémájának egy példánya (be- 
menete) egy (s,t) (s,t € E") alakú rendezett párokból álló véges P halmaz. 
A megfeleltetési feladat P bemenetét megoldhatónak nevezzük, ha vannak olyan 
(nem feltétlenül különböző) P-beli (s1, 1), (S2, t2), . . . , (Sn, tn) párok úgy, hogy 


Ss1S2-""$n — tit2 tn. 


A feltétel tehát az, hogy a kiválasztott párok első komponenseinek összeolvasá- 
sával adódó szó egyezzen meg a második komponensek egymás után fűzésével 
kapott szóval. Ilyenkor az $182 : : : Sa. vagy ami ugyanaz, a tito :::tn szót a P 
megoldásának nevezzük. Például a P — ((iz,ríz), (kar, ka), (ma, ma)) rend- 
szer megoldható. Egy lehetséges megoldás a karizma szó. 








Feladat: Mutassuk meg, hogy a P — ((ab, a), (ab, ba), (b, ba) ) rendszernek nincs 
megoldása. 

A következő feladatból kitűnik, hogy a megoldáshoz tényleg szükség le- 
het arra, hogy bizonyos párokat többször is felhasználjunk, Legyen P! - 
((aa, aab), (bb, ba), (abb, b). A P" bemenet tehát három párból áll. Ugyanakkor 
igaz a következő. 


Feladat: Mutassuk meg, hogy a P! rendszer megoldható, és a legrövidebb megol- 
dás négy párból illeszthető össze (azaz 4 a legkisebb n, amivel megoldást kapha- 
tunk). 


A probléma angol nevéből eredően (Posts correspondence problem) PCP 
jelöli a megfeleltetési feladat megoldható példányainak leírásaiból álló nyelvet. 
Megmutatható, hogy nincs algoritmus, ami a megfeleltetési feladat megoldható 
példányait felismerné. A PCP nyelv tehát nem rekurzív. Érvényes másfelől a kö- 
vetkező: 


Feladat: Mutassuk meg, hogy a PCP nyelv rekurzíve felsorolható. (Tegyük 
fel, hogy a megfeleltetési feladat P bemenete k párból áll. Vegyük sorra (n — 
1,2,3,...) az n hosszú sorozatokat, melyek tagjai az 1, 2, . . . , k sorszámok, és 
ellenőrizzük, hogy a sorozatnak megfelelő párok adnak-e megoldást.) 


7.8.5. Egy nyitott kérdés: a kongruens számok felismerése 


Az eldönthetetlenség témakörétől búcsúzva meg szeretnénk jegyezni, hogy nem 
egy lezárt kutatási területről van szó. Ennek érzékeltetésére egy olyan problémát 
ismertetünk, amelyre eddíg nem találtak algoritmust. és az eldönthetetlenségét sem 
sikerült bizonyítani. A probléma ártatlanul egyszerűnek tűnik, és bizonyos SZem- 
pontból igen régi. A fogalom, amihez kapcsolódik, már a X. század arab írástudó- 
inak a munkáiban is megtalálható. 
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Definíció: Az m pozitív egész kongruens szám, ha van olyan derékszögű három- 
szög, melynek a területe m, és az oldalai racionális hosszúságúak. 


Megmutatható, hogy I, 2, 3 és 4 nem kongruens számok. Már e tények igazo- 
lása sem túl egyszerű. Kis könnyebbség, hogy a négyesre vonatkozó állítás azon- 
nal következik az egyesről szólóból (és fordítva). Például, ha volna a négyeshez 
megfelelő derékszögű háromszög. akkor azt a felére kicsinyítve egységnyi terü- 
letű háromszöget kapnánk. 


Feladat: Használva, hogy az z! - y! — 2? diofantikus egyenletnek nincs csupa 
pozitív megoldásai, mutassuk meg, hogy a 2 nem kongruens szám. (Ha 2 kong- 
ruens szám volna, akkor léteznének olyan u, v, w pozitív egészek, melyekre 
u2 40? — w?, továbbá u és v relatív prímek, és uw négyzetszám. Az utóbbi 
két feltétel miatt u és v is négyzetszámok.) 


Mint azt Leonardo Pisano — ismertebb nevén: Fibonacci — 1220 körül megálla- 
pította, az 5 kongruens szám: 3/2, 20/3 és 41/6 a legegyszerűbb olyan racionális 
derékszögű háromszög oldalai, amelynek a területe 5. A sokszor látott 3, 4, 5 hár- 
mas mutatja, hogy 6 is kongruens szám. 


Felmerül a kérdés, van-e általános recept a kongruens számok felismerésére. 
Ilyet eddig nem sikerült találni. Nem ismert, hogy a kongruens számokból álló 
nyelv rekurzív-ef. 


Feladat: Mutassuk meg, hogy a kongruens számokból álló nyelv rekurzíve fel- 
sorolható. (Legyen n a bemenet. Generáljuk valamilyen sorrendben a pozitív ra- 
cionális számokból álló (p,r, s) hármasokat. Egy hármasról ellenőrizzük, hogy 
Pp" 4? — r? és pag/2 — n teljesülnek-e. Ha igen, akkor elfogadjuk n-et. Ellen- 
kező esetben folytatjuk a következő hármassal.) 


Jaz zt 4 yt — 2? egyenlet ilyen értelmű megoldhatatianságát Pierre Fermat igazolta. 

SAz aritmetikai geometria egy nevezetes sejtéséből, a Bírch-Swinnerton-Dyer-sejtésből követ- 
kezik, hogy a kongruens számok problémája eldönthető. Ez a hipotézis bizonyos harmadfokú sík- 
görbék racionális koordinátájú pontjairól szól. Jerrolá Tunnell bizonyította, hogy ha a sejtés igaz. 
akkor a kongruens számoknak van hatékony jellemzése. Ekkor a páratlan négyzetmentes n egész 
pontosan akkor kongruens szám, ha a 2? 4 y? 4 82? — n diofantikus egyenletnek kétszer annyi 
megoldása van, mint a 27? 4 y? 4 322? — n egyenletnek. Ebből rögvest látszik, hogy legfeljebb 
(n-4-1)? számú (x,y, 2) egész vektor víizsgátatával eldönthető, hogy n kongruens-e. Tunnel] hasonló 
tellemzést adott a páros n-ekre is. 
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7.9.  Kolmogorov-bonyolultság 


Rosencrantz: Fej. (Megismétlik.) 

Fej. (Zavart nevetéssel Guildensternre tekint.) 

Kezd egy kicsit unalmas lenni, nem? 

"TOM STOPPARD: Rosencrantz és Guildenstern halott 


Itt az információtartalom egy algorítmusokon alapuló megközelítésével foglalko- 
zunk, amit Gregory J. Chaitin, Andrej N. Kolmogorov és Ray J. Solomonoff dof- 
goztak ki a hatvanas években. Kiindulásul próbáljuk megfogalmazni, hogy egy 
T"t-beli szó mennyire tömören írható le; másképpen fogalmazva: milyen rövid, mi- 
lyen kevés jelből álló kóddal nyomható össze optimálisan. Az ilyen fogalomalkotó 
kísérletek egy lehetséges buktatójára világít rá az írógép-paradoxon: 

Tekintsük azokat a természetes számokat, amelyeket magyar nyelven legfel- 
jebb 100 billentyűleütéssel definiálni lehet. A billentyűk száma véges, így ezen 
számok halmaza is véges. Van tehát egy legkisebb természetes szám, amit nem 
lehet definiálni a fenti módon. De ekkor , az a legkisebb szám, amely nem defi- 
niálható magyar nyelven legfeljebb száz billentyűleütéssel" egy száznál rövidebb 
jelsorozat, tehát olyan számot határoz meg, amely mégis benne van a definiálható 
számok halmazában, ami nyilvánvaló képtelenség. 

A paradoxon arra figyelmeztet bennünket. hogy a , röviden való leírhatóság" 
csak úgy önmagában még nem lesz használható fogalom. Egy lehetséges kritika, 
hogy a magyar nyelven leírhatóság nem köti meg eléggé a leírás értelmezésének 
módját. Kössük ki tehát, hogy a leírás értelmezését, más szóval a dekódolást al- 
goritmussal, pontosabban — a Church-Turing-tézis alapján — Turing-géppel végez- 
zük. 

Milyen Turing-gépet használjunk erre a célra? Természetes elvárás, hogy a 
matematikai képlettel tömören leírható számok hatékonyan kódolhatók, jelentő- 
sen összenyomhatók legyenek. Például az n — 27 — 10 alakú számok bináris 
kódja k z logon hosszúságú, ha k 5 4. Viszont a 27 — 10 kifejezés hossza 
csak a 27 — 10 képlet hosszából valamint k bináris hosszából tevődik össze, ami 
log; log; n-- konstans. Szeretnénk, ha a fogalom tükrözné az ilyen alakú n számok 
rövid leírhatóságát. Sőt, olyan jellegű számokat is hatékonyan szeretnénk kódolni, 
mint a k-adik Fibonacci-szám, a k-adik prímszám, a r első k számjegye, stb. A 
leírást kibontó gépnek ezek szerint , értenie" kell az egyszerű aritmetikai képle- 
teknéi általánosabban az algoritmusokat is. Ennek a feltételnek eleget tesznek az 
univerzális Turing-gépek. 

Rögzítsünk tehát egy U univerzális Turing-gépet, és értelmezzük az z € DP 
szó bonyolultságát mint a legrövidebb yzéz input szó hosszát, melyre U az z szót 
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számítja ki. Az így adódó fogalom meglepően értelmesnek bizonyul, Az U gép 
választásától nagy mértékben független, és aszimptotikus értelemben jó (konstans 
eltérésen belüli) közelítését adja az , optimumnak". Példáut az n — 2 — 10 alakú 
számok bonyolultsága, mint várjuk, a 27 — 10 képlet hosszától eltekintve általá. 
ban log; log2 n lesz. Rövidebb akkor lehet, ha k speciális atakú (k-nak log; k-nál 
rövidebb leírása van). Azt ís igazolni tudjuk, hogy a legtöbb esetben k leírása nem 
lehet log; k-nál sokkal rövidebb. 

Legyen továbbra is 7 — f0, 1). Olyan Turing-gépekre szorítkozunk, amelyek. 
nek a bemenő abc-je I, és a számításaik eredménye is 7-beli betűkből áll. Egy 
ilyen M gép a korábbiakkal összhangban az fm : It Co I" parciális függvényt 
számolja ki. Jelöljük Cw()-szel annak a legrövidebb bemenő szónak a hosszát, 
mellyel elindítva M az x szót adja eredményül: 


- § min(lyl: ve I", fm(ly) xb ha ilyen y létezik, 
Oule) - í 00 különben. 

A Cm(z) szám méri, hogy z mennyíre nyomható össze akkor, ha a kibontást, 
vagyis az összenyomott szó visszafejtését az M algoritmus végzi: Cm() a leg- 
tömörebb kódszó hossza, mely az M algoritmus számára 2-et kódolja, A Cm(z) 
érték erősen függ M-től. Az x ismeretében könnyen szerkeszthetünk olyan Mi gé- 
pet, mely az üres bemeneten x-et számolja ki. Olyan Ma gép is van, amely sosem 
adja eredményül 2-et. Ekkor Cm, (2) — 0 és Cm (2) z 00. 

Most megmutatjuk, hogy az univerzális Turing-gépek körében a C érték nem 
függ ennyire vadul a gép választásától. Ki fog derülni, hogy a kibontó képessé- 
get illetően egy univerzális gép semelyik másik gépnél sem lehet számottevően 
rosszabb. Emlékeztetjük az olvasót, hogy egy U univerzális gép bemenete wits 
alakú, ahol w,s € I". Az érdekes esetekben w egy M Turing-gép leírása, amit 
Muevel is jelölünk. Az U gép a wiés bemeneten utánozza az M,, működését az 5 
inputtal. A továbbiakban feltesszük, hogy az univerzális gépeink is egyszalagosak. 
és a szalag-abc-jük (0, 1, í). Ennek megfelelően az 8 elválasztó jelet egy véges 
bítsorozat kódolja. 


Tétel (invariancia-téteb): Legyen U egy univerzális Turing-gép. Ekkor tetszőleges 
M Turing-gépre létezik egy (csak M-től függő) em € 27 állandó, mellyel minden 
a € TF" szóra teljesül a következő egyenlőtlenség: 


Cv(x) S Cm(r) 4 cm. 
Bizonyítás: Tegyük fel, hogy az M gép leírása a w € I" szó, és legyen y egy 


legrövidebb szó, amiből M az x-et bontja ki: y € It, fm(y) — z,éslyi 7 
Cmí(r). Az univerzális gép definíciója szerint ekkor U a wity bemeneten r-et 
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adja eredményül; más szóval fu(wjty) — r. Ebből a Cy függvény értelmezése 
alapján következik, hogy 


€v(x) S hojtyi — kozt 4 ly — hozél 4 Cm(2). 
A cm — Iwzél választás tehát megfelel a követelményeknek. Ö 


Az invariancia-tétel szerint a Cy(:r) érték csak legfeljebb egy r-től független állan- 
dóval haladhatja meg Cwm(r)-et. Ezt úgy értelmezhetjük, hogy az [-hoz tartozó 
összenyomhatóság mértéke nem marad el számottevően semelyik másik M gép 
szerinti összenyomhatóságtól sem. 





Következmény: Legyenek U; és U2 univerzális Turing-gépek, melyek input abc- 
jeT — (0.1). Ekkor van olyan c — c ua állandó, hogy minden za € IT" szóra 


ICu(z) — Cuo(z)] S c. 


Bizonyítás: Alkalmazzuk az invariancia-tételt először az U — U1, M — U2, majd 
pedig az V — U2, M — Ul szereposztással. Adódik, hogy tetszőleges z € I" 
szóra teljesülnek a Cy.(z) S Cvuo(z) 4 cu, és Cv.(z) S Culr) 4 ey, egyen- 
lőtlenségek, ahol ey, az U;-től függő pozitív állandó. Arra jutunk ezekből, hogy a 
c — maxfcrn , cu, ) értékkel [Cy, (x) — Cy.(z)I £ e teljesül. 0 


Az előző szerint Crr(z) nem függ nagyon erősen az U univerzális gép válasz- 
tásától. Ha U! egy másik univerzális gép, akkor a Cy(x) és Cyr (r) eltérése egy 
2-től független korláton belül marad. Ez alapot ad arra, hogy egyetlen — mostantól 
fogva rögzített — U univerzális gép segítségével tanulmányozzuk az összenyomha- 
tóságot. 


Definíció (Kolmogorov-bonyolultság): 
Legyen z € I". A O(x) :— Cu(z) mennyiség az x szó Kolmogorov-bonyolultsága. 


Egy függvény definícióját látva az embernek olykor kedve támad, hogy ki- 
számolja néhány helyettesítési értékét. Mi lesz például C(0010)? Kíváncsiságunk 
mindjárt akadályba ütközik: az V-t nem adtuk meg elég pontosan ahhoz, hogy 
a meghatározást követve számolhassunk vele. Rövidesen kiderül, hogy C(z) ki- 
számítása nehéz feladat; a C függvény nem rekurzív. Mihez lehet hát kezdeni 
€gy ilyen függvénnyel, amelynek az értékei és számolhatósága körül ennyi gond 
van? A válasz az, hogy C(rn) alakú sorozatok növekedési rendjét érdemes vizs- 
gálni, ahol xi, x, . . . növekvő hosszúságú I"-beli szavak sorozata. Például az 
n — 25 — 10 alakú számokra C(n) £ log; logan - d teljesül alkalmas c" állan- 

.  dóval. Az egyenlőtlenség bal oldalán n € I" az n szám szokásos bináris kódját je- 
löli. Az egyenlőtlenség az invariancia-tétel egyszerű következménye. Van ugyanis 
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olyan algoritmus, amely a binárisan írt, és ezért legfeljebb log; loga n 4- 1 hosszú- 
ságú k-ból n-et számítja ki. A megfelelő M géppel tehát Cm(n) £ log; log n-4-1, 
és innen az invariancia-tétel adja a C(n)-re vonatkozó állítást. 

Az invariancia-tétel további egyszerű következménye, hogy egy /"-beli szó 
Kolmogorov-bonyolultsága nem haladja meg lényegesen a szó hosszát: 


Következmény: Legyen x € I". Ekkor Cíx) £ Iz 4-k, ahol k egy £-től független 
állandó. 


Bizonyítás: Jelölje M azt a Turing-gépet, amely az inputot érintetlenül hagyva 
egy lépésben megáll. Nyilván fwíz) — z, sőt Cm(r) — fxzj is teljesül bármely 
x € I szóra. Az M gépre alkalmazhatjuk az invariancia-tételt; éppen a kívánt 
egyenlőtlenséget kapjuk. CO 


A fordított irányt illetően megmutatjuk, hogy a szavak túlnyomó többségének 
a Kolmogorov-bonyolultsága közel van a szó hosszához. Vannak olyan szavak is, 
amelyek nem írhatók le rövidebben, mint a saját hosszuk. Ezeket külön névvel 
illetjük: 


Definíció: Az xr € I" szó összenyomhatatlan, ha C(z) 2 Iz. 


Tétel: Legyen k € Zt. Legfeljebb P! — 12 € Tt szó van, melyre C(x) £ k. 
Következésképpen minden n 2 1 egészre létezik n hosszúságú összenyomhatatlan 
szó. Han 5 8, akkor az n hosszú It-beli szavak több, mint 99 százalékának a 
Kolmogorov-bonyolultsága nagyobb, mini n — 8. 


Bizonyítás: Legyen 
Hh-(rerF: C(a) Sk) 


Ha xz, 1" € Hi, akkor a Kolmogorov-bonyolultság definíciója szerint vannak olyan 
y.y € I" szavak, melyekre fu(y) — z, fuly) — z, továbbá lyi c k és [yI £ £. 
Nyilvánvaló, hogy ha z 17, akkor y yi, hiszen U egy bemenetéhez nem tar- 
tozhat két különböző eredmény. A H;. halmaznak eszerint legfeljebb annyi eleme 
lehet, mint ahány k-nál nem hosszabb szó van !"-ban. Az utóbbi szavak száma 
Pedig1-42-4 42571 p.2F — 26 — 1. Ezzel az első állítást igazoltuk. 

A második ak — n — 1 választással azonnali adódik az elsőből: az n hosszú 
szavak száma 27 , a H,, .4 halmazban pedig legfeljebb 27 — 1 szó van. Létezik tehát 
olyan n hosszú szó, ami nincs H).1-ben; ez egy összenyomhatatlan szó. 

Hátra van még az utolsó állítás. A H,-s halmaznak legfeljebb 27-77 - 1 € 
2"-T eleme van. A kedvezőtlen esetek aránya az n hosszú szavak között így leg- 
feljebb 27-T/2" — 1/128, ami kisebb, mint 1/100. D 
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Feladat: Legyen w : Zt c Zt egy végtelenhez tartó függvény, azaz 
Timna oo wW(n) — oo teljesüljön. Igazoljuk, hogy ekkor 


lm Kzer:] n, Cím) 5 n— win] jé 
ri-aB0 HzeT:Te-ni 








1. 


Vagyis , majdnem minden" z szóra igaz a C(r) 5 Írj — wí]z]) egyenlőtlenség. 
(Mutassuk meg, hogy a [H,. o(ml/27 hányados nullához tart.) 


Egy tipikus szó Kolmogorov-bonyolultsága tehát közel van a hosszához. En- 
nek furcsa ellenpontjaként említhetjük, hogy mégsem tudunk minden n-re egy 
olyan n hosszú z, szót algoritmussal előállítani, amelyre mondjuk C(xn) 2 n/2. 
Ha volna ugyanis egy M Turing-gép, ami a binárisan írt n inputra egy ilyen fn 
szót adna, akkor Cmízn) £ logan - 1, és az invariancia-tétel alapján C(xrn) £ 
logon - c teljesülne. Az utóbbi mennyiség viszont elég nagy n-re kisebb lesz. 
mint n/2. Ez pedig ellentmond a C(za) 2 n/2 feltételnek. Ezek után már az sem 
meglepő, hogy a Kolmogorov-bonyolultságot nem lehet kiszámítani: 








Tétel: AC: P o PF függvény nem rekurzív. 


Bizonyítás: A szokásos bináris ábrázolás segítségével a Z-t halmazt IF" részének 
tekinthetjük. Legyen ezután F : Zf — I" a következő függvény: 





F(ím) — min(x e I:C(zy 2 mh), 


ahol a minimumot az I"-beli szavak kanonikus rendezése szerint értjük. Az F min- 
den természetes számra értelmezett, mert létezik tetszőlegesen nagy Kolmogorov- 
bonyolultságú szó. Tegyük fel indirekte, hogy C rekurzív. Ezt a feltevést használva 
megmutatjuk, hogy F parciálisan rekurzív, azaz van olyan M Turing-gép, melyre 
F — fm. Az M algorítmus munkája az m bemenetnél felettébb egyszerű: vesszük 
az x € TF" szavakat a kanonikus sorrendben, és kiszámítjuk a C(r) értéket. Ezen 
a ponton aknázzuk ki a C rekurzivitását. Kiírjuk az első olyan x szót, amelyre 
Cír) 2 m, és megállunk. Mármost az F definíciója szerint 


m £ C(F(m)). 
Másrészt az invariancia-tétel alapján alkalmas c-vel igaz, hogy 
C(F(m)) S Cm(iP(m))-- e. 
Ugyanakkor a Cm értelmezése szerint, ha m 5 0, akkor 


CmiF(m)) S logm-- 1, 
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hiszen M a binárisan ábrázolt m inputból előállítja F(m)-et. A kapott egyenlőt- 
lenségeket összerakva m 5 0 esetén arra jutunk, hogy 


m$£logymt lt e, 


ami elég nagy m-re lehetetlen. Az így nyert ellentmondás bizonyítja, hogy C nem 
rekurzív. J 


A Kolmogorov-bonyolultság néhány alkalmazása 


A Kolmogorov-bonyolultság önmagában is érdekes fogalom, de ezenfelül kitűnik 
még a sokoldalú, színes alkalmazási lehetőségeivel. Eme alkalmazások közül itt 
hármat említünk. 


1. A Megállási probléma eldönthetetlensége 


A Kolmogorov-bonyolultság tulajdonságait használva egyszerűen igazolható, 
hogy az Ln megállási nyelv eldönthetetlen. Tegyük fel ugyanis indirekte, hogy 
létezik egy az Lx nyelvet felismerő, mindig megálló M algoritmus. Megmutat- 
juk, hogy az M segítségével a C függvény kiszámítható, ami ellentmond az előző 
tételnek. 

Legyen z € 1". A Cíx) érték az (egyik) legrövidebb olyan y € I" szó hossza, 
melyre fyu(y) — r. Itt nyilván elegendő az olyan y szavakra szorítkozni, melyek- 
kel mint bemenetekkel az U valamikor megáll. A Cí(r) meghatározásához tehát 
a kanonikus sorrendben vesszük az y € I" szavakat. Egy y szóra először az M 
algoritmussal ellenőrizzük, hogy U megáll-e az y inputtal. Ha a válasz nemleges, 
akkor eldobjuk y-t, és vesszük a következő szót. Ha a válasz igenlő, akkor az y- 
nal elindítjuk az U-t. Az U munkájának végeztével ellenőrizzük, hogy az fuly) 
eredmény egyenlő-e x-szel. Ha nem, akkor a kanonikus sorrend szerint következő 
y-nal próbálkozunk. Az első olyan y szónál állunk meg, amelyre fuly) — Tr. és 
kiírjuk az y hosszát. Ilyen y létezik, és a vázolt recepttel véges sok lépésben meg 
is találjuk. 





Feladat: Mutassuk meg, hogy a 
(rán: zeP nezt, C(x) Sn) 
nyelv rekurzíve felsorolható, de nem rekurzív. (Az első állításhoz a (Z)?-beli 


párok algoritmikus felsorolása használható. A másodikhoz mutassuk meg, hogy 
ha a nyelv rekurzív lenne, akkor a C függvényt ki tudnánk számítani.) 
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2. Palindrómák felismerése egyszalagos Turing-géppel 


Korábban láttuk, hogy egy k szalagos AMf Turing-gép szimulálható olyan egy- 
szalagos N géppel, melynek az időfüggvénye legfeljebb az M időfüggvényének 
négyzetével arányosan nő: Ty(n) — O(T9,(n)). Most megmutatjuk, hogy ez a 
kvadratikus becslés éles: egy olyan nyelvet ismertetünk, mely kétszalagos géppel 
tazaz 0(n)) időben felismerhető, egyszalagos géppel viszont nem ismer- 
hető fel o(n?) lépésen belül. 

Egy szót palindrómának vagy tükörszónak nevezünk, ha visszafelé olvasva 
is magát a szót kapjuk. Például a kajak egy tükörszó. Az egyik legnevezetesebb 
palindróma a Napóleon sírkövén levő felirat: ABLE WAS I ERE I SAW ELBA. 

Legyen L, az I"-beli palindrómákból álló nyelv. Könnyen látható, hogy két- 
szalagos Turing-géppel egy n hosszú w € PP szónak az Lp-be tartozása O(n) 
lépésben eldönthető: először felmásoljuk a iv input szót a második szalagra, majd 
az első fejjel visszamegyünk a szalag elejére. Végül a két fejjel ellentétes irányban 
haladva ellenőrizzük, hogy a tükrösen elhelyezkedő jelek egyeznek-e, Egyszalagos 
géppel már nem megy ilyen gyorsan: 











Tétel; Nincs olyan egyszalagos M Turing-gép, amely az Lp nyelvet ismeri fel, és 
amelynek időfüggvényére Tm(n) — o(n?) teljesül. 


Először megpróbálunk szemléletes képet adni a bizonyításban szereplő gon- 
dolatokról. Legyen M egyszalagos Turing-gép, amelynek a nyelve L, és nézzük 
M munkáját egy n hosszú s € /" input szón. Osszuk három egyenlő részre a sza- 
lagnak a bemenetet tartalmazó részét. Az (s € L,?) megválaszolásához a gépnek 
valahogy össze kell vetnie az s első harmadát az utolsóval. Az M konstans mennyi- 
ségű — mondjuk b bit — információt tud a belső állapotaiban tárolni, és ezért a fej 
mozdításával egy hellyel arrébb vinni. Az M munkáját úgy képzeljük el, hogy az 
s első harmadából való információdarabokat vet össze az s végén található párjuk- 
kal. Az összehasonlítás elvégzéséhez viszont a gépnek az egyik darabkát el kell 
vinnie a másikhoz, ami legalább n/3 lépést jelent. A gép így összesen legalább 
n/3 bit információt szállít el legalább n/3 cellányíra. Egy lépésben 6 bitet képes 
egy hellyel arrébb vinni. Tehát az n/3-n/3 — n?/9-bít - cella fuvar teljesítéséhez 
legalább n?/(9b) lépés kell. 

Hogy mindezeket pontossá tegyük, meg kell fogalmaznunk, mi is az informá- 
ció, amit M szállít. Erre szolgál az átketőnapló. Legyen c az M gép egy szalag- 
cellája. Tekintsük M futását az s € I" bemeneten, és jegyezzük fel sorra az M 
állapotát azokban a pillanatokban, amikor a fej átlépi a c cella jobb oldali határát. 
Az így adódó 91, 92, - . . , fm Sorozat a c cella árkelőnaptója. Az első átlépéskor (ez 
szükségképpen jobbra lépés) M a gi állapotban van, a másodiknál (ami balra lé- 
Pés) g2. stb. Mint a bizonyításban látni fogjuk, az átkelőnapló tényleg úgy vehető, 
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mint a c határán átmenő információ hű jegyzőkönyve. Világos, hogy az átkelő- 
napló mig bittel leírható (€2 az M belső állapotainak halmaza). Az átjutó infor. 
máció mennyiségének mérésére pedig a Kolmogorov-bonyolultság lesz alkalmas. 
A következő takaros érvelés Wolfgang J. Paultól származik, 


A tétel bizonyítása: Tegyük fel, hogy M egyszalagos Turing-gép, melyre 
Lm — Lp. Elég igazolni, hogy az n — 3k hosszúságú bemeneteken M legalább 
dn? lépést tesz, ahol d 5 0 állandó, és n elég nagy. Feltehetjük, hogy megálláskor 
M feje az első cellára mutat; ez a lépésszám duplázása árán elérhető. 

Nézzük M működését egy s — wl"aw" alakú bemeneten, ahol w egy k hosszú. 
ságú összenyomhatatlan szó, és w" jelöli a w szó fordítottját. Az s egy n hosszú- 
ságú palindróma. 

Tekintsük az s középső harmadát tartalmazó cellák átkelőnaplóíit. Ha ezek 
mindegyike több, mint n/(1010)) bejegyzést tartatmaz, akkor M ezen a bemene- 
ten több, mint n/(1010]) - n/3 — n?/(30101]) lépést tett. Ekkor készen vagyunk; 
az ilyen bemeneten M tényleg nem végezhet o(n?) lépésben. Feltehető tehát, hogy 
van olyan c cella a középső harmadban, amelynek az átkelőnaplójában legfeljebb 
n/(1010D) állapot szerepel. Megmutatjuk, hogy ez ellentmondáshoz vezet, ha n 
elég nagy. 

Pontosabban azt igazoljuk, hogy van olyan M" algoritmus, amely az n szám- 
ból, a c cella i sorszámából és a c-hez tartozó átkelőnapló leírásából rekonstru- 
álja a w szót. M!-nek ez a bemenete leírható 21og2 n 4 2 - n/10 bittel. Ebből 
tehát Cm(w) £ 2logan 4 2-4 n/10 és az invariancia-tétel alapján C(w) £ 
2logan -4 2 -- n/10 4 cm következne. Kellően nagy n-re ez tényleg ütközik a 
C(w) 2 k — n/3 feltevéssel. 
zután a dőlt betűs állítást bizonyítani. Az M" algoritmus sorra veszi 
ú xr € I" szavakat. Egy ilyen szóval a következőket teszi: 

(1) Felírja M szalagjának elejére az e1í7" szót. 

(2) Szimulálja M lépéseit, amíg az nem lép túl a e celtán. 

(3) Ha M megáll elutasító állapotban, akkor M" az (1)-től újrakezdi a következő 
2 szóval. 

(4) Ha M elfogadó állapotban áll meg, akkor M! kiírja az z szót, és megáll. 

(5) Ha M feje jobbra el akarja hagyni c-t, akkor ellenőrzi, hogy M belső állapota 
megegyezik-e az átkelőnaplóban következővel (ez kezdetben g1). Ha nem, akkor 
újra kezdi a munkát a következő x szóval. 

(6) Ha az állapotok egyeznek, akkor M" átugorja M-nek a c-n túli működését. 
Ez annyit tesz, hogy M-et az átkelőnapló szerint következő (ez először g2 leheb 
állapotba teszi, a fejét a c cellára állítja. Ezután (2) szerint folytatja a szimulációt. 





A lényeges észrevétel az, hogy ha az (5)-beli teszteknél mindig igen a válasz, 
akkor a szimulációnál az első í cellán pontosan ugyanaz történik, mint ami akkor 
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történne, ha M-et az r1w" szóval indítanánk el. Ez közvetlenül adódik a Turing- 
gép definíciójából: a c-től jobbra eső részen a működés csak az átlépő állapoton 
keresztül függ a szalag elején történtektől. Ugyanígy a szalag elején a c-től jobbra 
levő munka csak a visszatérő állapoton keresztül tud hatni. 

Az r — w szó nyilván minden tesztet túlél. AM éppen a palindrómákat fogadja 
el, ezért a szimuláció pontosan akkor ál! meg M elfogadó állapotánál, ha x — w. 
Az M" algoritmus tehát tényleg előállítja a uw szót. Ezzel a bizonyítás teljes. 0 


3. Véletlen sorozatok 


A Kamra színházban vagyunk. Kezdődik a Rosencrantz és Guildenstern halott. 
Kihunynak a fények, minden sötét. Valami nesz hallható, aztán valaki - később 
megtudjuk, Rosencrantz az — azt mondja, hogy fej. Majd megint nesz, és megint 
fej. Ez többször ismétlődik. Egy idő után a közönség felismeri az , algoritmust", 
enyhe derültség, és az egyik pénzkoppanás után már a nézők is súgják, hogy fej. A 
publikum érzékeli, hogy nagyon nem szokványos, ami történik. 

" Ha pénzdarabot dobálunk fel, és mondjuk ötvenszer egymás után fej adódik, 
mint ahogy ez Stoppard darabjában történik, akkor úgy érezzük, hogy ez igen 
különös, és egyáltalán nem véletlenszerű. Egy véletlen sorozatot kuszának, sza- 
bályosságok nélkülinek képzelünk. A valószínűségszámítás jól ismert alapfogal- 
mai viszont nem adnak módot ilyesfajta különbségtételre. A csupa fej sorozat 
ugyanolyannak látszik, mint bármelyik másik sorozat, hiszen minden egyes s0- 
rozat ugyanazzal a 2759 eséllyel fordul elő. 

A Kolmogorov-bonyolultság talán legérdekesebb vonása, hogy segítségével 
értelmesen definiálható a véletlen sorozat. A kapott fogalom igen határozottan 
megkülönbözteti a szabályos sorozatokat a kuszáktól. A többféle lehetséges meg- 
határozás közül itt csak egyet ismertetünk. Jelölje I"" a végtelen 0-I sorozatok 
halmazát. Egy x € I" sorozatra legyen xn az x első n bitjéből álló szó. 


Definíció (Kolmogorov-véletlen sorozat): Az z € I" sorozat egy véletlen soro- 
zat, ha Vim og AZ — 1. 

Egy sorozatot tehát akkor tekintünk véletlennek, ha a kezdőszeletei véges sok 
kivétellel nagy Kolmogorov-bonyolultságúak (közel összenyomhatatlanok). Ne- 
vezzünk egy 2 € I" sorozatot algoritmussal előállíthatónak, ha van olyan Turing- 
gép, amely a binárisan megadott n bemeneten éppen az rna szót adja eredményül. 


Állítás: Ha az z € IP sorozat algoritmussal előállítható, akkor x nem véletlen 
Sorozat. 
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Bizonyítás: Legyen M egy az x-et előállító Turing-gép. Ekkor Cw(fn) c 


logan 4 1. Az invariancia-tétel szerint C(ra) £ legan 4 1 4 em, amiből 
emg 
si . 


A csupa fej" sorozat tehát nem véletlen sorozat. A fogalom sok más érte- 
lemben is megfelel a véletlenről meglevő intuitív képünknek. Igazolható például, 
hogy ha z egy véletlen sorozat, akkor £n-ben körülbelül ugyanannyi nulla van, 
mint egyes. 

A véletlen sorozat definíciójával kapcsolatban nem árt némi óvatosság. Voltak 
olyan nevezetes kísérletek, amelyekről később kiderült, hogy túl szigorúak abban 
az értelemben, hogy egyetlen sorozat sem teljesíti az előírt kikötéseket. Itt most 
nem ez a helyzet, Sőt, az is igaz. hogy 199 majdnem minden eleme véletlen sorozat, 


ÉTEL: AMARRA 





Tétel: Tegyük fel, hogy az x € I sorozat bítjeit egymástól függettenüt 1/2 való- 
juk. Ekkor a T valószínűséggel véletlen sorozat tesz, 





színűséggyel vált 


Bizonyítás; A C(rn) £ n 4 c egyenlőtlenségek miatt ha x nem véletlen, akkor 
van olyan e 5 0, hogy C(20)/n c 1-—eteljesül végtelen sok n-re. Legyen k € Zt 
és 

Sr - (x € IS; van végtelen sok n, melyre C(xn)/n c 1—1/k). 


Ha x nem véletlen, akkor az előzőek szerint  € 54 alkalmas k-ra. Innen 


ax 
Prob(x nem véletlen) £ 3 Proba € 54). 
k-1 


Elég tehát megmutatni, hogy a Prob(zr € $4) valószínűségek mind nullák. Le- 
gyen ezután k egy rögzített pozitív egész, és jelölje An azt az eseményt, hogy 
C(an)/n c 1 — 1/k, Világos, hogy z € S, egyenértékű azzal, hogy az An ese- 
mények közül végtelen sok következik be. A Borel-Cantelli-lemma " alapján elég 
belátni, hogy a 2-1 Prob( An) sor konvergens. A Prob( An) mennyiség becslé- 
séhez először megjegyezzük, hogy a korábbiak szerint kevesebb, mint 264—1/4jnt1 
szó Kolmogorov-bonyolultsága lehet kisebb, mint (1 — 1/k)n. Ezt használva 
9(1—1/k)nál 
Prod(A) ges 2 EZREN za (2 2 VT 

A Aa Prot( An) sor majorálható egy konvergens geometriai sor kétszeresével. 
A bizonyítás ezzel teljes. C 


SA Borel-Cantellí-lemma szerint ha Ai, Az, . . . olyan események egy valószínűségi mezőből. 
amelyekre DS , Prob( Aa) konvergens, akkor 0 a valószínűsége annak a B eseménynek, hogy az 
A; események közül végtelen suk bekövetkezik. A temma azonnal adódik abból a tényből, hogy 
tetszőleges n-re a B benne van az An, Án-1,. . . események egyesítésében, tehát Prob(B) £ 
Ef, Prob( Ap), és a jobb oldali összeg n választásával tetszőlegesen kicsivé tehető. 
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7.10. A közvetlen elérésű gép (RAM) 


Ittegy olyan gépmodellt tárgyalunk, mely a Turing-gépeknél sokkai jobban hason- 
lít a szokásos számítógépekre. A RAM rövidítés az angol random access machine 
elnevezés kezdőbetűiből származik. A gép nevében a közvetlen elérés, illetve a 
random access arra utal, hogy a memóriája a tömbökhöz hasonlóan egyetlen elemi 
lépésse! elérhető cellákból áll. A modell bevezetésével több célunk is van. Elő- 
ször is: a közvetlen elérésű gép a Turing-gépeknél sokkal! kényelmesebb eszköz, 
ha algoritmusokat akarunk tervezni. Másfelől segítségével pontosan, ugyanakkor 
eléggé valósághűen definiálható a számítások időköltsége. Végezetül pedig a mo- 
del! fontos adalékot szolgáltat a Church-Turing-tézishez. Megmutatjuk, hogy a 
közvetlen elérésű gépek szimulálhatók Turing-gépekkel. 

A közvetlen elérésű gép alkotórészei a következők: egy kizárólag olvasásra 
használható input szalag, egy csak írható owput szalag, a belső tár és a program- 
tár, A szalagok és a belső tár cellákból állnak és (egyirányban) végtelen hosszúak. 
Egy cella egy tetszőleges egész számot tartalmazhat. A belső tár celláit a termé- 
szetes számokkal sorszámozottaknak tekintjük. Kitüntetett a nulladik cella, az ak- 
kumulátor, ami az elemi műveletek egyik operandusát, és általában az eredményét 
is tartalmazza. 

A programtárban található a gép programja. A program sorszámozott — SZO- 
kásos kifejezéssel: címkézett — utasítások véges sorozata. AZ utasításszámláló egy 
mutató, ami az éppen végrehajtandó utasításra mutat. A gép — értelemszerűen - 
az input szalagról veszi a számítás bemenő adatait; az eredmény pedig az output 
szalagon jelenik meg. 








input szalag 








akkumulátor 


tár 














output szalag 
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A következő táblázat a közvetlen elérésű gép utasításait tartalmazza. Ez egyike 
csupán a lehetséges és értelmes utasításkészleteknek. Az irodalomban többféle 
változattal találkozhat az olvasó. A táblázatban az utasítás neve után az utasítás 
Paramétere szerepel. 





Aritmetika ] Adatmozgatás ! Vezérlés 

ADD opíLOAD op [JUMP — címke 
SUB op! STORE op [IGTZ címke 
MULT opíjREAD op (JZERO címke 
DIV op! WRITE op ! HALT 

















kt op az adott utasítás (egyik) operandusa. Az operandusok háromfélék le- 
hetnek. Jelöljön í egy egész számot. Az — iz alakú operandus — az ún. közvetlen 
operandus — az í egészet jelenti. Az í operandus a belső tár i-edik cellájának a 
tartalmát jelenti. A si formájú operandus az indirekt címzés eszköze. Jelentése az 
1-edik tárcellában található sorszámmal azonosított cella tartalma. Tehát ha például 
r[0) — —4 és r[1] — 0. akkor a 41 operandus jelentése —4. Az i és xi alakú hivat- 
kozásokban i szükségképpen nemnegatív egész. (A hibák kezelésével kapcsolatos 
kérdésektől eltekintünk.) 

Az aritmetikai műveletek az összeadás (ADD), kivonás (SUB), szorzás 
(MULP és osztás (DIV) első argumentuma az akkumulátor, a másodikat az op pa- 
rTaméter éj A művelet eredménye az akkumulátorba kerül. Például ha r(0) — 17 
és r(1] — 2, akkor DIV I hatására a 8 — [17/2] érték kerül az akkumulátorba. 
ra az aktuális input cella tartalma az op paraméter 
által leírt tárcellába kerül. Az input szalagon az utasítás végrehajtása után a fej egy 
cellányit jobbra lép. A WRITE op az aktuális output cellába írja az op-pal azonosí- 
tott egészet. Itt op közvetlen operandus is lehet. A fej az írás után egy hellyel jobbra 
tép az output szalagon. A STORE op utasítás hatására az akkumulátor tartalma az 
operandus által megadott (esetleg indirekt) című tárcellába kerül; közvetlen ope- 
randus itt nem használható, mert nem jelöl címet. A LOAD op utasítás a fordított 









irányú adatmozgatásra szolgál; itt megengedett a közvetlen (konstans) operandus 
is. 


A H6ET utasítás hatására a "PrÓSKAN megát A tövábbi három vezérlést sza- 
ül az ugrási fel- 
tétet, akkor a program a címke ál 2 sorszámú utas issál folytatódik. 
Minden más esetben a programtár következő u! 
ugrási feltételek a következők: JZERO: r(0) — 0, IGTZ: r(0] 2 0, JUMP: üres — 
azaz mindig teljesül. 

A RAM-modell két értelemben idealizálja a szokásos egyprocesszoros archi- 
tektúrákat: nincs megkötés a tár, illetve a szalagok méretére. Ezenfelül nincs , szÓ- 
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hossz", azaz egy cella tetszőlegesen széles egész számot tartalmazhat, Egyebekben 
a modell megfelel az assemblerben programozható és némi perifériával kiegészí- 
tett processzornak, 


Költségszámítás 

A RAM-programok időigényének mérésére kétféle mérőszámot szokás alkal- 
mazni. Az egyik az uniform költség. Egy program uniform költsége a futása s0- 
rán végrehajtott utasítások száma. Úgy ís mondhatjuk, hogy minden elemi utasítás 
költsége I. A rendezés, a keresés és a gráfalgoritmusok kapcsán lényegében ezt 
a mérési módot használtuk. Becsléseink a módszerek uniform költségére adtak 
nagyságrendi korlátokat. 

Az uniform költség használatakor nem árt egy kis körültekintés, Mindenféle 
huncutságot el lehet követni úgy, hogy óriási méretű számokkal dolgozunk. Így 
alacsony költséget kaphatunk olyan számításokra is, amelyek gyakorlati megva- 
lósítása igen drága, Egyszerű példaként tekintsük az f(n) — 89 függvényt. Az 
f(n) érték kiszámítható lineáris, azaz O(n) uniform költséggel: legyen z :— 3, 
majd n-szer iterálva x :— x?, Ugyanakkor vegyük észre, hogy a k-adik iterációs 
lépésben két 2"-jegyű számot szorzunk össze. Az eredménynek tehát 2"H jegye 
lesz. Ha mondjuk n — 1000, akkor 1000 elemi műveletet végzünk, a 21991 bitből 
álló eredmény leírásához viszont a világ minden papírja sem elegendő. 

A logaritmikus költség kiküszöböli ezt a fogyatékosságot, amennyiben érzé- 
keny a számításban szereplő adatok méretére is. Ennél a számolási módnál egy 
utasítás költsége a benne szereplő adatok összhossza. Egy egész szám hossza a 
bináris jegyeinek száma --1, hogy az előjelre is tekintettel legyünk. Az adatok nél- 
küli utasítások (JUMP, HALT) költsége 1. Egy program logaritmikus költsége a 
végrehajtott utasítások költségeinek az összege. 








Példa: ADD 51 uniform költsége 1. A logaritmikus költsége viszont 
hosszír[0]) 4 hosszír(1]) 4 hosszír[r(1]]) 4- hossz(1), 


ahol r[i] a belső tár i-edik cellájának a tartalmát jelöli. 


A logaritmikus költség a valósághoz hű mérőszámot ad olyan programok ese- 
tén, amelyek nem tartalmaznak MULT, illetve DIV utasításokat. Ennek az alapja 
az, hogy a többi elemi művelet ténylegesen megvalósítható a benne szereplő ada- 
tok hosszával arányos időköltséggel. Például az összeadás és a kivonás esetén az 
iskolában tanult táblázatkítöltő módszer ilyen tulajdonságú. A szorzásra és az osz- 
tásra viszont mindeddig nem találtak olyan algoritmust, ami n bites bemenetek 
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esetén n-nel arányos számú bit-művelettel megadná az eredményt". 

A két költségfogalmat összevetve megállapíthatjuk, hogy az uniform költséget 
könnyebb számolni, becsülni, a logaritmikus költség pedig pontosabb, valóságo- 
sabb mérőszámot ad. Az uniform költséget akkor értelmes használni, ha tudunk 
valami korlátot a számítás során keletkező adatok méretére. Ha egy RAM-program 
végig legfeljebb ( hosszúságú adatokkal dolgozik, és az uniform költsége m, akkor 
a logaritmikus költsége O(Im). 

Az igazi számítógépek processzorai szó-szervezésűek. Ez egyebek közt azt 
jelenti, hogy a szóhossz korlátozza az elemi műveletek operandusainak hosszát, 
Másfelől az alkalmazások tekintélyes részénél a természetesen adódó elemi adatok 
és az ezekből nyert részeredmények beleférnek egy gépi szóba. Az ilyen esetekben 
az uniform költség, vagyis az elemi műveletek száma használható mérőszámot ad. 


Szimulációk 

A következő tétel azt állítja, hogy a közvetlen elérésű gépek és a Turing-gépek 
számító ereje megegyezik. Ezzel adalékot szolgáltat a Church-Turing-tézishez. 
Másfelől a RAM-ok csiszoltabb architektúrájuknak köszönhetően gyorsabbak. A 
hatékonyságbeli nyereség azonban egy négyzetes korláton belül marad. A tétet le- 
hetővé teszi, hogy ha hatékony algoritmust akarunk készíteni, akkor a programozás 
természetéhez közelebb álló RAM-modellt használjuk. 


Tétel (Turing-gép. RAM szimulációk): 

(1) Tetszőleges M Turing-gép szimulálható O(Tm(n) logTmín)) logaritmikus 
költségű RAM programmal. A szimuláció uniform költsége O(Tw(n)). 

(2) Egy tín) logaritmikus költségű, MULT és DIV utasításokat nem tartal- 
mazó RAM-program szimulálható olyan N Turing-géppel, melynek az időigényére 
Tw(n) — O((n)) teljesül. 


Bizonyítás: (vázlat) 

(1) Legyen M egy k-szalagos Turing-gép. Az általánosság rovása nélkül feltehet- 
jük, hogy M szalagjelei és belső állapotai is természetes számok. Feltehetjük azt 
is, hogy az elfogadászelutasítás tényét Af az output szalagjának első mezején jelzi. 
A szimuláció megkezdése előtt M bemenete a RAM input szalagjára van írva. Egy 
cellában egyetlen szalagjel szerepel. A RAM belső tárának első c celláját munka- 
területként használjuk. A c egy az M-től függő állandó. Ebben az első részben 
tároljuk az M aktuális belső állapotát, és itt kap helyet az a k cella is, amelyekben 
az M fejeinek helyzetét ábrázoljuk. 








TA számítógépes aritmetika talán legnevezetesebb nyitott kérdése, hogy van-e ilyen algoritmus. 
A ma ismert leggyorsabb módszert Arnold Schönhage és Volker Strassen találta. Az algoritmus két 
n jegyű szám szorzásához O(n log n og log n) bit-műveletet használ. és nem praktikus. 
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A belső tár további részében összefésülve" tároljuk az M szalagjainak tartal- 
mát: az M j-edik szalagjának í-edik celláját a belső tár c — 1-4 j -- ki sorszámú 
cellája jelenti. 

A RAM programja tartalmazza az M átmeneteinek leírását. Az M egy lépését 
a közvetlen elérésű gép a bemenet hosszától független konstans számú lépésben 
utánozza. A fejezet elején vázolt if...then... utasítások megvalósíthatók konstans 
sok RAM-alapművelettel. A RAM az M celláinak megfelelő helyeket indirekt 
címzéssel éri el a tár első részében levő mutatók alapján. 

A programnak n jelből álló bemenet esetén szimulálnia kell az M legfeljebb 

Tm(n) lépését. Ennek az uniform költsége O(Twín)). Ugyanezen a korláton be- 
lül maradva átmásolhatjuk az M output szalagjának (érdemi) tartalmát a RAM 
output szalagjára. A szimuláció uniform költsége tehát összesen is O(Tw(n)). A 
logaritmikus költség becsléséhez nézzük a szimuláció során fellépő számok mé- 
retét: az M szalagjelei és belső állapotai (M-től függő) konstans hosszúságúak, a 
fejek helyét leíró mutatók pedig 0(log Tw(n)) bittel ábrázolhatók. A szimuláció 
logaritmikus költsége tehát O(Tm(n) log Tm(n)). 
(2) A RAM-programot szimuláló N gép szalagjelei legyenek (0, 1, 4, —, s, űj). 
Az első négy jellel binárisan írt előjeles egészeket kódolunk, a sé elválasztójelként 
fog szolgálni. N-nek öt szalagja lesz. Az elsőn a RAM belső tárát ábrázoljuk, 
a másodikon az akkumulátor tartalmát. A harmadik szalag munkaszalag lesz, a 
negyedik és az ötödik pedig a RAM input, illetve output szalagjának fele! meg. Az 
utóbbi két szalagon a binárisan ábrázolt egészeket s jelek választják el egymástól. 
N szalagjai tehát így néznek ki. 


A RAM belső tára 
Az akkumulátor tartalma 


Munkaszalag 





ARAM input szalagja 


ATRAM output szalagja 





Külön figyelmet érdemei az első szalag, amin a RAM belső memóriáját szi- 
muláljuk. Ez a szalag címé adar alakú feljegyzéseket tartalmaz, $£-é jelekkel el- 
választva. 





[elm fadon tcímetadatz Hichnzfadatztűcimi túj-adat, fcimzítúj-adat, fitcímzttúj-adat; . . . . . 





SEzt az ötletet érdemes megjegyezni. Változatait gyakran használják az ún. dinamikus allokációt 
igénylő helyzetekben: amikor is egyetlen tartományban több. dinamikusan változó méretű állományt 
kelt kezelni 
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Például az 11078 — 10001 pár azt jelenti, hogy r[6) — —17. Egy adott című re- 
kesz , beolvasását" N úgy végzi, hogy végigpásztázza az első szalagot a legutolsó 
olyan feljegyzésig. amelynek a cím része egyezik az adott címmel. A megfelelő 
adatrészt ezután az akkumulátort ábrázoló szalag elejére írja, és a végére üresjelet 
tesz. A , kiírás" úgy történik, hogy a megfelelő cún4adat párt az első szalag végére 
írjuk. Azért használunk mindig új helyet, mert előfordulhat, hogy a szóban forgó 
cellában tevő szám mérete megnőtt, és már nem férne el a korábbi helyére. 

A RAM alaputasításainak az N állapotcsoportjai felelnek meg. Például van 
egy az összeadáshoz tartozó állapotcsoport. Amíg N az összeadást végzi, addig az 
aktuális belső állapota ebből a csoportból kerül ki. A következő RAM-utasításra 
lépést, illetve az ugrásokat N az állapotcsoportok közötti átmenettel valósítja meg. 

Az alaputasítások közül a LDOAD és a STORE szimulációját már vázoltuk, To. 
vábbi példaként tekintsük az ADD x9 megvalósítását: 

1. Először N megkeresi az első szalagon a legutolsó olyan feljegyzést, aminek a 
címrésze 787410017£. Ha nincs ilyen, akkor N megáll, a szimuláció nem folytat- 
ható, hiszen az indirekt címzés értelmetlen. Ha a keresett cím szerepel a szalagon, 
akkor a mögötte levő a adatot N a harmadik szalag elejére másolja. 

2. Megkeresi az első szalagon az utolsó feljegyzést, aminek a címrésze a harmadik 
szalagon levő a érték, Ha ez nem lehetséges, akkor N megáll, Ha a keresés sikeres 
volt, akkor az a címhez tartozó b adatrészt a harmadik szalag elejére másolja. 

3. A harmadik szalagon található b számot hozzáadja az akkumulátor tartalmához, 
vagyis a második szalagon levő számhoz; az eredmény a második szalagon jelenik 
meg. 


Ezeket a mintákat követve nem nehéz meggondolni, hogy az alaputasítások 
-— a MULT és DIV kivételével — megvalósíthatók úgy, hogy N lépésszáma az uta- 
sításban szereplő adatok hosszával plusz az első szalag érdemi részének hosszával 
arányos legyen, Ha a RAM bemenetének mérete n volt, akkor a logaritmikus költ- 
ség definíciója szerint ez az összhossz 0(t(n)), így egy lépés szimulációjának a 
költsége is O0(t(n)). 

A RAM tín) lépésének szimulációjához tehát N legfeljebb t(n)O(t(n)) - 
O(t(n)) lépést tesz. 0 
Feladat: Mutassuk meg, hogy két n jegyű egész szorzása, illetve osztása Turing- 
géppel 0(n?) lépésben elvégezhető. 


Feladat: Mutassuk meg, hogy egy tetszőleges (MULT és DIV utasításokat ís hasz- 
náló) RAM-program szimulálható egy olyan N Turing-géppel, amelyre Twv(n) 7 
O0(t(n)). 


A tétel, illetve az utóbbi feladat szerint ha egy algoritmikus probléma megold- 
ható T(n) költséggel az egyik modellben, akkor megoldható legfeljebb O(T?(n)) 
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költséggel a másik modellben is. A két modell tehát polinomiálisan összehason- 
lítható abban az értelemben, hogy az egyiknél számított költség becsülhető a má- 
sikon vett költség egy polinomjával. Ha tehát pusztán az érdekel bennünket, hogy 
egy feladatra van-e 0(n") költségű algoritmus valamilyen c 5 0 kitevővel? , akkor 
közönmtbös, hogy melyik gépmodellben gondolkodunk. 


"Hatékony algoritmusok keresésekor gyakran ez az első kérdés, amivel foglalkozunk. 


8. 


Az NP nyelvosztály 


Az ember s az idő mindig összetalálnak, 
mint a keserűlapi saját árnyékával. 
TAMÁSI ÁRON 


Ebben a fejezetben először algoritmusok időbeli és tárhasználat szerinti hatékony- 
ságát vizsgáljuk. Definiálunk néhány olyan jellemzőt, melyek lehetővé teszik a 
hatékonyság pontosabb értelmezését. E fogalmak segítségével megadható a (lega- 
lábbis elméleti értelemben) hatékonyan kezelhető algoritmikus problémák köre (P 
és FP osztályok). A legtöbb eddig tárgyalt feladat (nyelv, függvény) ezen osztályok 
egyikébe tartozik, Mint látni fogjuk, sok gyakorlati szempontból fontos feladat 
— a mai tudásunk szerint — kívül esik ezeken az osztályokon, vagyis nem oldható 
meg hatékony algoritmusokkal. E nehezebb feladatok közül kiemelkedő fontossá- 
gúak azok, amelyek az NP osztályba tartoznak. Itt most csak azt emeljük ki, hogy 
nagyon sok fontos algoritmikus feladat vezet NP-beli problémához. Az NP-beli 
nyelvekkel kapcsolatban első közelítésként a bevezető példáink egyikére, Arthur 
király kérésére utalunk. Képzeljük el, hogy a király csak annyit kérdez Merlintől, 
hogy párokba állíthatók-e a lovagok és az udvarhölgyek úgy, hogy a vonzalmakat 
is figyelembe vegyük. Merlin a válasz mellé egyszerűen ellenőrízhető bizonyítékot 
mellékethet: a megfelelő párok listáját. Ennek birtokában a király hatékonyan el- 
lenőrizheti a válasz helyességét. Az NP-beli nyelvek éppen ezzel a tulajdonsággal 
jellemezhetők. Az igen válasznak van gyorsan ellenőrizhető bizonyítéka. 

Külön figyelmet fogunk szentelni az NP osztály legnehezebb feladatainak, az 
NP-teljes feladatoknak, Az NP-osztályra úgy gondolhatunk mint a természetesen 
felmerülő nyelvek nagy gyűjtőhelyére; az alján vannak a hatékonyan, gyorsan 
felismerhető nyelvek (a P osztály), a tetején pedig a nehéz, gyors algoritmussal 
nem megoldható problémák, az ún. NP-teljes nyelvek. Utóbbiakkal azért fogtalko- 
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zunk behatóbban, mert szinte minden alkalmazási területen előfordulnak. Az NP- 
teljességgel kapcsolatos ismeretek gyakran segítenek annak megítélésében, hogy 
egy elénk kerülő algoritmikus feladat megoldására remélhetünk-e gyors módszert. 


8.1.  Idő- és tárkorlátok 


Kétmilliárd férfi húszezer évet borotválkozik 
naponta. GARACZI LÁSZLÓ 


Szeretnénk viszonylag pontos fogalmakat adni arra, hogy egy algoritmus gyors, 
illetve hogy hatékonyan bánik a tárral. Ezt úgy tesszük, hogy korlátozzuk az al- 
goritmus (Turing-gép) számolási idejét vagy a felhasznált tárcellák számát. Nyil- 
vánvalóan nem lenne jó abszolút, a bemenettől független korlátokat bevezetni, hí- 
szen természetesnek tartjuk, hogy hosszabb inputon egy módszer több időt/tárat 
használ; már pusztán a bemenet elolvasása, értelmezése több munkát jelent. A két 
törekvés összebékítésének egy lehetséges módja, hogy az idő- és tárfelhasználást 
az input hosszánuk függvényében vizsgáljuk. Legyen t : Zt c Z1 egy függvény, 
melyre minden n € Zt esetén t(n) 2 n teljesül. 


Definíció (t(n) időkorlátos TG): 
Az M Turing-gép tín) időkorlátos, ha n hosszú inputokon legfeljebb t(n) lépést 
tesz (más szóval Tm(n) £ t(ín)). 


A t(n) függvény tehát korlátozást ír elő az M gép lépéseinek a számára. A 
t(ín) 2 n azt a természetes feltevést tartalmazza, hogy a gép legalább végigolvas- 
hatja az inputot a megadott időkorláton belül maradva. Az M algoritmust (TG-0) 
akkor tekinthetjük gyorsnak, ha tín) egy lassan növekedő függvény. 

A 7.1. pontbeli első példa, a hárommal való oszthatóságot ellenőrző M Turing- 
gép n hosszú inputokon legfeljebb n -- 1 lépést tesz, tehát mondhatjuk, hogy n 4-1 
időkorlátos. A másik példa, az f(n) :— n--1 függvényt kiszámító M gép nem lesz 
t(n) időkorlátos semmilyen t függvénnyel, mert vannak olyan inputok, amiken a 
gép sohasem áll meg. 


Feladat: Adjunk meg egy olyan n 3 1 időkorlátos N Turing-gépet, melyre 
Lun — Lm és fv — fm. ahol M a fenti TG. 


A hatékony algoritmus fogalmának a birtokában megpróbálkozhatunk a fela- 
datok hatékonyság szerinti osztályozásával. Azokat a feladatokat (nyelveket, függ- 
vényeket) tekintjük alacsony bonyolultságúnak, melyek megoldására létezik gyors 
algoritmus. Ezt készíti elő a következő fogalom. 
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Definíció: 
TIM Eít(n)) :— íz cp 





L felismerhető egy O(t(n)) időkorlátos 
M Turing-géppel : 


A TIM E(t(n)) nyelvosztályba tehát azok az L nyelvek tartoznak, amelyekhez 
létezik ct(ín) időkorlátos TG. A e állandó függhet L-től, A definíció lényeges 
eleme, hogy n hosszú z inputokon a számítás mindig befejeződik legfeljebb ct(n) 
lépésben, tekintet nélkül arra, hogy z € L igaz-e. Ennek következményeként 
TIM E(t(n)) rekurzív nyelvekből ált, 

A legegyszerűbb példát a fineáris időben felismerhető nyelvek jelentik: 


Példa: TIM E(n) — (az O(n), azaz lineáris időben felismerhető nyelvek). 


Algoritmikus időigény szempontjából a lineáris időben felismerhető nyelvek 
tekinthetők a legkönnyebbeknek. Szokásos még a TIM E(n?) nyelvosztályt a 
négyzetes, TIM E(n?)-t pedig a köbös időben felismerhető nyelvek összessé- 
gének nevezni. A következő nyelvosztály központi szerepet játszik a számítások 
elméletében: 








Definíció: P — Uka TIM E(n?), a polinom időben felismerhető nyelvek osztá- 
ya. 


Példa: L — fő1"I n 2 1) € TIME(n) € P. Könnyen szerkeszthető olyan 
kétszalagos Turing-gép, mely a fenti nyelvet lineáris időben ismeri fel. 


Állítás: Ha az E nyely n982.nél rövidebb időben nem ismerhető fel, akkor L £ P. 


Bizonyítás: Indirekt érveléssel tegyük fel, hogy £ € P. Ekkor a P definíciója sze- 
rint van olyan k 5 0, melyre L € TIM E(n?), és így alkalmas c 5 0 konstansra 
nen c en? teljesülne végtelen sok n-re. Ez az egyenlőtlenség viszont ellentmon- 
dást jelent, híszen a bal oldalon álló függvény gyorsabban nő, mint a jobboldali. 
a 


Az időhöz hasonlóan kezelhetjük az algoritmusok tárfelhasználását és a nyel- 
vek felismerésének tárigényét, Legyen s : Z2t c Zt olyan függvény, melyre 
minden n € 27? számmal igaz, hogy s(n) 2 loga n. 


Definíció (s(n) tárkorlátos TG): 
Az M Turing-gép s(n) tárkorlátos, han hosszú inpítokon legfeljebb s(n) tárcetlát 
használ a munkaszalagokon (azaz Sm(n) £ sín). 
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Az sín) 2 log n kikötés enyhe és értelmes feltevés. Ennyi hely kell ugyanis 
ahhoz, hogy egy n cellából álló szatagrészt - például az input szalag érdemi ré- 
szét — címezni tudjunk. Emlékeztetünk még itt arra, hogy ha M-nek csak egy 
szalagja van, akkor az a definíció szempontjából munkaszalagnak tekintendő. Az 
időosztályokkal analóg módon kapjuk a tárosztályok definícióját: 


Definíció; 
SPAGE(s(n)) :— íz er 





az L felismerhető egy O(s(n)) tárkorlátos 
M Turing-géppel jj 


Példa: SPACE(log n) a logaritmikus tárban felismerhető nyelvek osztálya. Ha az 
L nyelv a SPACE(log n) osztályban van, akkor felismerhető egy olyan M TG- 
vel, ami n hosszú inputokon legfeljebb clog n tárcellát használ a munkaszalagjain. 
A c állandó itt is függhet L-től. 


A nyelvekhez hasonló módon kaphatunk idő-, illetve tárkorlátokkal meghatá- 
rozott függvényosztályokat. Csupán annyit kell tennünk, hogy a definíciókban a 
nyelveket felismerő TG-k helyett függvényeket kiszámoló TG-ket szerepeltetünk. 


Definíció: PTIM E(t(n)) :— az O(t(n)) időkorlátos TG-k által kiszámítható f : 
It a I" fiiggvények osztálya. 


Definíció: FSPACE(s(n)) :— az 0(s(n)) tárkorlátos TG-k által kiszámítható 
f: It I" (parciális) függvények osztálya. 


Igen fontos osztály a P-vel analóg függvényosztály FP, a polinom időben ki- 
számítható függvények osztálva: 


Definíció: FP :— Ursa FTIME(n)). 
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8.2. Tár-idő-tétel, nevezetes nyelvosztályok 


Jóllehet a világot alkotó atomok száma mérhetetlenül nagy, nem végtelen, 
ezért csupán véges számú (még ha mérhetetlenül nagy is ez a szám) permu- 
tációt adhat. Ha végtelen az idő, a lehetséges permutációk száma egyszer 
kimeríthető, s akkor szükségszerűen megismétlődik a világegyetem. Ismét 
megszületsz majd egy anyaméhből. ismét kifejlődik a csontvázad, ismét 
ugyanebbe a kezedbe kerül ez a lap, ismét végigéled életed minden óráját 
a hihetetlen halál percéig. JORGE LUIS BORGES 

(Így foglalja össze a nietzschei Örök Visszatérést.) 





A következő állítás egy alapvető összefüggést rögzít a tár-, illetve időkorlátokkal 
definiált osztályok között. Ha egy nyelv felismerésére van tárkorlátos algoritmus, 
akkor van időkorlátos is. Az adódó időkorlát a tárkorlát exponenciális függvényé- 
vel becsülhető. A gondolatmenet kezdőpontja az, hogy ha egy tárkorlátos számítás 
elég sokáig tart, akkor szükségképpen végtelen ciklusban van. A végtelen ciklusok 
felismerése, kezelése jelenti a probléma — és a bizonyításban szereplő konstruk- 
ció - érdemi részét. 


Tétel (tár-idő-téteh: Ha L € SPACE(s(n)), akkor van olyan L-től függő c 
konstans, mellyel L€ TIM E(e"9) teljesül. 


Bizonyítás: Legyen M egy S(n) — cisí(n) tárkorlátos (cz 2 1) k-szalagos TG, 
mely felismeri L-et. Az M-ből kiindulva egy olyan 0(c5(")).időkorlátos N TG-t 
fogunk konstruálni, melynek a nyelve szintén L. Nézzük M számításait az n 
hosszúságú inputokon. Egy ilyen számítás során a gép egy pillanatnyi helyzetét 
pontosan jellemzi az input (összesen n jel), a munkaszalagok tartalma (össze- 
sen legfeljebb S(n) cella), a gép aktuális belső állapota, valamint a fejek hely- 
zete a szalagokon. Egy ezeket rögzítő , jegyzőkönyvet" pillanatnyi helyzetleírás- 
nak (PHL) nevezünk. Az M gép átmenetei és egy PHL ismeretében pontosan meg 
tudjuk mondani az M következő lépését, sőt a következő PHL-eket ís. Ilyen ér- 
telemben egy PHL a számítás egy pillanatát hűen rögzítő fényképnek tekinthető. 
Mindebből számunkra most az a fontos, hogy ha a gép futása során egy PHL ismé- 
telten előfordul, akkor a gép biztosan végtelen ciklusban van, a két helyzet közötti 
lépéssor végtelen sokszor ismétlődik. A gép tárkorlátos voltából adódik, hogy egy 
számítás során csak véges sok PHL lehetséges. Így ha a gép elég sokáig fut, akkor 
egy PHL feltétlenül ismétlődik, tehát végtelen ciklusba kerültünk. 

Nézzük ezt kícsit pontosabban! Hány darab PHL lehetséges összesen, ha a 
gépet n hosszú inputtal indítjuk? Érvényes a következő egyszerű felső becslés 


8.2. TÁR-IDŐ-TÉTEL, NEVEZETES NYELVOSZTÁLYOK 251 


($PHL a PHL-ek száma): 
$PHL S IRT (n 4 DS(ny, 


ahol I] az M belső állapotainak száma, IT] az M szalagjeleinek száma, az (n--1) 
tényező az input fej lehetséges helyzeteinek a száma, az S(n)f tényező pedig a 
többi fej lehetséges helyzeteinek a száma, Használva, hogy S(n) 2 s(n) 2 loga n, 
a ca :— 2 ITI választással 


$PHL £ konstans : cs) 


adódik. Jelöljük t-vel a jobboldalon álló számot. Ha egy n-hosszú £ inputon a gép 
t lépés után sem áll meg, akkor biztosan végtelen ciklusba került, hiszen ekkor van 
olyan PHL, ami két különböző lépés után előfordul. Kézenfekvő volna tehát M-et 
t lépés után lelőni. Az a baj ezzel az ötlettel, hogy nem feltétlenül tudunk eddig 
elszámolni, hiszen lehet, hogy a t korlát nem rekurzív függvénye n-nek. Olyan 
megoldásra van szükség, amely nem épít a t ismeretére. 

Ennyi előkészület után lássunk az N gép konstrukciójához! A végtelen cik- 
lusok felismerése és kezelése céljából megduplázzuk M-et. Legyen Mi és M2 a 
két példány. Ezeket a gépeket N részeinek tekintjük. Az M)-et elindítjuk az x 
ínputtal. Minden egyes lépése után ideiglenesen megállítjuk; ekkor M2-t elindít- 
juk x inputtal a kezdő állapotból, és működtetjük legfeljebb addig a lépésig, ahol 
M) tart (jelölje ennek a lépésnek a sorszámát 7). Az ! sorszámot 0(S(n)) extra 
cellán tároljuk és léptetjük. Ha valamely j C I-re az Ma gép j-edik lépés utáni 
PHL-je megegyezik M1-ével, akkor biztosan végtelen ciklusba kerültünk (PHL ís- 
métlődik), tehát re € L. Ekkor N megáll elutasítva x-et. Ha ilyen ismétlődés nem 
fordult elő, akkor meglépjük Mi következő, 1-- 1-edik lépését, ! :— 1-1, és ismé- 
teljük az előző eljárást. Természetesen ha M1 megáll elfogadva (elutasítva) T-et, 
akkor N is megáll elfogadva (elutasítva) x-et. 

Ezzel a megoldással biztosan felismerjük a végtelen ciklusokat: valójában már 
az első olyan / után megállunk, amikor egy PHL ismétlődik. Az új. összetett gép 
működése során ezért mindig teljesül azt C t egyenlőtlenség. Innen már meg- 
becsülhető N erőforrás-igénye. Beszámítva a számlálók (Z és j) karbantartását 
és a PHL-ek összehasonlításának költségét is, a maximális futási idő legfeljebb 
0(£2) z O((c32) - O((ezjas9), ígyc s cz megfelel a tétel követel- 
ményeinek. További fontos tény, hogy a tárfelhasználás sem nőtt lényegesen: az 
összetett gép működéséhez 0(s(n)) tárcelta elegendő a munkaszalagokon. 0 

A bizonyítás minden nehézség nélkül átvihető nyelvek helyett függvényekre. 
Egyetlen számottevő módosítás célszerű: végtelen ciklus esetén, amikor az x in- 
putra f nem értelmezett, legyen f(x) — x. Az így kapott (teljes) függvény szintén 
az FSPACE(s(n)) osztályba tartozik. 
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Tétel: Ha f € FSPAC E(sín)), akkor van olyan f-től függő c konstans, mellyet 
f€ FTIME(c99)o 


Nézzük most, hogy mi mondható idő- és tárkorlátokkal definiált nyelvosztá- 
lyok esetén a komplemens nyelvek osztályairól. Emlékeztetésül: ha X nyelvek 
egy osztálya, akkor a coX nyelvosztály éppen I" ) L alakú nyelvekből áll, ahol 
L € X. Így pl. a coTIM E(t(n)) nyelvosztályban a TIM E(t(n))-beli nyelvek 
komplementerei vannak. 

Egyszerűen adódik, hogy TIM E(t(n)) — coTIM E(t(n)). Legyen ugyanis 
M egy ctín) időkorlátos M TG, ami az L nyelvet ismeri fel. Ha megcseréljük 
az M elfogadó és elutasító (azaz nem elfogadó) állapotait, akkor a kapott N TG 
éppen az I" § L nyelvet ismeri fel, és szintén ctín) időkorlátos. Analóg állítás 
érvényes tárosztályokra is; ennek az igazolása viszont kevésbé egyszerű. 


Tétel: SPACE(s(n)) — coSPACE(s(n)). 


Bizonyítás: Legyen L € SPACE(s(n)). Alkalmazzuk a tár-idő-tétel szimuláci- 
óját. Az adódó N TG szintén 0(s(n)) tárkorlátos, és minden inputra megáll. Erre 
a gépre már működik időosztályoknál bevált ötlet: cseréljük fel az elfogadó és az 
elutasító állapotokat. DO 


Megemlítünk itt két további fontos nyelvosztályt, az exponenciális időben fel- 
ismerhető, valamint a polinom tárban felismerhető nyelvek osztályait. 


Definíció: EXPTIME :— Uzi TIM E(27). 
Definíció: PSPACE :— Uxz15PACE(n?). 


Az EXPTIME osztályra úgy nézhetünk, mint a gyakorlatban előforduló nyel- 
vek (eldöntési feladatok) univerzamára. Ezt úgy értjük, hogy nemigen van olyan 
praktikus feladat, ami ezen kívül levő, még nehezebb nyelvhez vezetne. Érvénye- 
sek a következő tartalmazási viszonyok: 


Tétel: P C PSPACE C EXPTIME 


Bizonyítás: Ha M egy tín) időkorlátos TG, akkor szükségképpen ctín) tárkor- 
látos is, hiszen egy lépésben legfeljebb annyi új cellára léphet, mint a szalagjai- 
nak száma. Ezt alkalmazva kapjuk, hogy TIM E(n?) c SPACE(n!), amiből 
P C PSPACE következik. A másik állítást illetően legyen L € PSPACE. Ekkor 
L € SPACE(n?), valamely k-ra. A tár-idő-tétel szerint ekkor van olyan c 5 0, 
hogy L E TIME(e"") c TIMEeledr?) c TIME(2""") € EXPTIME. a 
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Megjegyezzük még — a C jellel valódi tartalmazást jelölve -, hogy 
TIM Et(tín)) C R. SPACE(sín)) C R és EXPTIME C R. Ezek a tények 
a korábban már megismert árlós eljárás alkalmazásával igazolhatók. Az ötlet ér- 
zékeltetésére mutatunk egy rekurzív nyelvet, ami nincs az EXPTIME osztályban. 
Legyen 


L z (we Tt; az M,, TG létezik, és legfeljebb 27" lépésben elutasítja 1-t). 


Itt [ev] jelöli a w szó hosszát. Először gondoljuk meg, hogy ha M egy t(n) időkor- 
látos TG, akkor végtelen sok olyan y € I" szó van, amire M), létezik, és ugyanúgy 
viselkedik, mint M. Az utóbbi azt jelenti, hogy My is t(n) időkorlátos és ugyanazt 
a nyelvet ismeri fel, mint M: Lm, - Lm. Ilyen gépeket kaphatunk például úgy, 
hogy M belső állapotainak halmazát bővítjük olyan állapotokkal, amelyek sosem 
érhetők el a kiinduló helyzeteiből. (Tulajdonképpen az történik, hogy egy progra- 
mot olyan részletekkel bővítünk, amelyekre sohasem kerül a vezérlés. A program 
ugyanúgy működik, mint az eredeti, de a leírása hosszabb lesz.) 

Most megmutatjuk, hogy L nincs benne a TIME(ZT) nyelvosztályban. 
Ebből, EXPTIME C TIM E(27"") miatt következik, hogy L £ EXPTIME. In- 
direkt gondolkodva tegyük fel, hogy L felismerhető egy e2277! időkorlátos M 
TG-vel. Legyen ng olyan nagy, hogy 2" c 2?" teljesüljön, han 5 no. Legyen 
w egy no-nál hosszabb szó, melyre M., létezik, és ugyanúgy viselkedik mint M. 
Ez a gép is c2 időkorlátos, és L — Lm... A befejezés hasonlít a diagonális 
nyelvnél látottakra: ha w € L, akkor Ma elfogadja w-t A"! a 22" lépésben, 
amiből L definíciója szerint w £ L következik. Ugyanígy képtelenséghez vezet a 
w g L feltevés is. 


Feladat: Mutassuk meg, hogy a fenti L nyelv rekurzív. 


A P, FP, PSPACE, EXPTIME osztályok robusztusak abban az értelemben, 
hogy nagymértékben függetlenek a gépmodelltől, amelynek a segítségével defi- 
niáltuk őket. Például szorítkozhattunk volna csak az egyszalagos Turing-gépekre, 
vagy használhattuk volna a RAM modellt. A TG-RAM szimulációkra kapott kor- 
látokból azonnal következik például, hogy 


van olyan k € Zt és c 5 0, hogy L felismerhető ) 


g. 4 
Ház (z cI en" logaritmikus költségű RAM-programmal 





Feladat; Mutassuk meg, hogy a lineáris időben felismerhető nyelvek osztálya 
TIM E(n) nem robusztus osztály. (Nézzük a palindrómák nyelvét egy-, illetve 
kétszalagos gépeken.) 
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Elméleti szempontból a polinom idejű algoritmusokat tekinthetjük hatéko. 
nyaknak. Ez több értelemben is megfelel a hatékonyságról meglevő tapasztalati 
képünknek. A lineáris, kvadratikus, sőt még a köbös algoritmusok gyorsaságával 
is általában elégedettek vagyunk. Bizonyos esetekben az ennél valamivel nagyobb 
kitevőjű módszerekkel ís békét tudunk kötni. A sokkat nagyobb időigényű eljá. 
rások viszont (legalábbis amelyek viszonylag természetesen merülnek fel) hasz- 
nálhatatlanok hosszú inputokon. Nézzünk mondjuk égy 2" időigényű módszert 
n — 1000 hosszúságú input esetén! Ez a méret nem jelent gondot a mai gépeken 
n, n? sőt n§ lépésszámú algorítmusoknál sem. Ezzel szemben a ma ismert fizi- 
kai elveken alapuló gépekre gondoldva teljesen reménytelennek tűnik, hogy 21090 
lépést megtehessünk egy emberöltő alatt. 

Azt is hangsúlyoznunk kell, hogy nem minden polinom idejű módszer ad iga- 
zán hatékony megoldást. Egy en" futási idejű algoritmus is lehet elfogadhatatlan 
gyakorlati szempontból, ha c vagy k nagy. Aligha tekinthetünk jónak mondjuk 
egy n?00 lépésszámú módszert. A polinom idejű algoritmus tehát a hatékony 
módszer absztrrakciójának, elméletileg kezelhető általánosításának tekintendő. 
Két fontos tulajdonsága ebből a szempontból, hogy egyrészt tényleg tartalmazza 
az igazán hatékony (pl. lineáris, kvadratikus idejű) algoritmusokat, másfelől pedig 
robusztus fogalom az előbb tárgyalt értelemben. Ennek a kis fejtegetésnek az 
összegzéséül az elméleti értelemben hatékonyan kezelhető feladatok a következők: 














P: — polinom időben felismerhető nyelvek 
FP: — polinom időben számítható függvények 











A legtöbb aigorítmikus probléma, amivei korábban az adatszerkezetek ele- 
meinél és a gráfalgoritmusok kapcsán találkoztunk, P-beli nyelv felismeré- 
sére, vagy általánosabban FP-beki függvény kiszámítására vezet. Például az 
T1,T2,...,€n ET" szavak lexikografikusan rendezett sorrendjének előál 
megfogalmazható mint a következő (nyilvánvalóan FP-beli) f függvény kiszámí- 
tásának a feladata: 

f:mregkr...kün e yi yt... tk ynaholyi £y d... S yn Az Ti 
szavak lexikografikusan rendezett sorozata. Néhány további ilyen feladat: 

1. Kupacépítés 
2. Minimális költségű feszítőfa keresése gráfban (Prim és Kruskal módszere ) 

3. Maximális párosítás keresése páros gráfban (magyar módszer) 

4. Maximális folyam számítása egész kapacitásokkal rendeikező hálózatban (Dinic 
algoritmusa) 

5. Gráf csúcsainak 2 színnel való kiszínezése. 











Nézzük meg közelebbről mondjuk a magyar módszert! Mint már láttuk, ennek 
az uniform költsége 0(ne), ahol n az éllistával adott G bemeneti gráf pontjainak. 
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e pedig az éleinek száma. Az éllistának n -k 2e cellája van. Az éllista egy cel- 
lája kb. $logn biten elfér: ebből logn bit a cellához tartozó csúcs sorszáma. A 
cellában levő mutatóra mintegy 2 ]og n bitet szánunk. Ezek elegendően hosszúak 
lesznek, mivel összesen legfeljebb n? cella van a szerkezetben. Az input hossza 
tehát körülbelül 3(n 4- 2e) log n bit. 


Feladat: Mutassuk meg, hogy a magyar módszer megvalósítható O(nelogn) 
logaritmikus költségű RAM-programmal. (Arra kell csak ügyelni, hogy a ma- 
gyar módszer egy elemi lépésének a logaritmikus költsége ne legyen több, mint 
O(1logn)) 

A feladat szerint a magyar módszer logaritmikus költsége az input hosszának 
négyzetével arányos korlát alatt marad. A módszer tehát tényleg polinom idejű. 


Az előzőekkel szemben ellenpontként álljon itt néhány (mai ismereteink sze- 
rint) polinom időben nem megoldható feladat. Ezek látszólag egymástól távol eső 
problémák, mégis algoritmikus szempontból sok közük van egymáshoz. Egyebek 
között ennek a kapcsolatnak fogunk utánajárni a következőkben. 

1. Hamilton-körrel rendelkező gráfok felismerése 

2. Utazó ügynök probléma (minimális költségű Hamilton-kör találása) 
3. A 3 színnel színezhető gráfok felismerése 

4. Maximális méretű klikk keresése gráfokban. 


8.3. . Nemdeterminisztikus Turing-gépek; az NP nyelvosz- 
tály 


Az eddig tárgyalt gépmodellek (TG, RAM) valósághoz közelinek mondhatók ab- 
ban az értelemben, hogy elég hűen tükrözik a számítások tényleges időigényét. A 
most terítékre kerülő modell ebből a szempontból alaposan elrugaszkodott a való- 
ságtól. Hogy miért foglalkozunk vele mégis? Mert segítségével igen természetesen 
körülhatárolható egy érdekes és gazdag nyelvosztály. A modellt tehát mint definí- 
ciós eszközt érdemes szemlélni. 

A nemdeterminisztikus Turing-gép (röviden NTG) definíciója abban tér el az 
egyszalagos Turing-gépétől, hogy a ő átmenetfüggvény nem egyértékű. A ő a le- 
hetséges lépések olykor egynél több elemű véges halmazát jelöli ki: 





6(g,a) C 0 x T x fjobb, bal, helyben). 


Ennek megfelelően a gép esetleg több lehetőségből választhat. A g állapotban az 
a szalagjel mellett a következő lépést a ő(g, a) halmazból kell választani. 
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A gép futása (egy számítási út): 


Kiindulási helyzet: 

Mint az egyszalagos TG-nél, az z € I" input szó a szalagon van, balra igazítva, 
utána üresjelek. A gép a go kezdőállapotban van, a fej pedig a szalag első celláján, 
Egy lépés: 

A gép egy pillanatnyi állapotát a belső állapot, a szalag tartalma, valamint a fej 
helyzete határozza meg. A következő pillanatnyi állapotba úgy jut el, hogy a belső 
állapotból, valamint a fej alatt található szalagjelből álló párra alkalmazva a ő hal- 
mazértékű függvényt, választja annak egy tetszőleges elemét, majd az annak meg- 
felelő belső állapotot veszi fel, miközben a megfelelő szalagjelet írja a fej alatti 
cellába, majd a megfelelő fejmozgatást végzi el. Ha az adott párra ő nincs értel- 
mezve, akkor a gép megáll. 

Példa: Tegyük fel, hogy a gép a g állapotban van, a fej alatti szalagjel a, és 
ó(g, a) — ((g. a, helyben), (ai, b, jobbra), (g2,c,balra)). Ekkor a gép a három 
lehetséges lépés közül választhat, mindegyik választás megengedett. 


Definíció (input elfogadása): Az M NTG elfogadja az x € T" inputot, ha az M-et 
2 bemenettel a kiinduló helyzetből indítva van legalább egy elfogadó (egy elfogadó 
állapotban véget érő) számítási út. 


A korábbiakkal összhangban jelölje Lm az M által ilyen értelemben elfogadott 
nyelvet. A definícióból közvetlenül adódik a következő: 
Állítás: Az a € I" input szó pontos. 
inputtal indítva nincs elfogadó számít 


n akkor nincs Lm-ben, ha az M gépet z 
út. 








Az NTG-k számításait néha hasznos egy gyökeres irányított faként elképzelni. 
A fa csúcsait a gép pillanatnyi helyzeteivel címkézhetjük. Egy csúcsnak annyi fia 
van, ahány lépés megengedett a csúcsnak megfelelő pillanatnyi helyzetből. A pél- 
dabeli gép esetén, ha a pillanatnyi helyzetben a belső állapot g, a fej alatti szatagje! 
a, akkor a csúcsnak három fia van. A fa gyökerét az z € T" inputnak megfelelő 
kiinduló helyzettel címkézzük. A gép pontosan akkor fogadja el az x inputot, ha 
a fában van olyan gyökértől levélig menő út, melynél a levélhez elfogadó állapot 
tartozik. 

A közönséges Turing-gépek mintájára beszélhetünk időkorlátos nemdetermi- 
nisztikus gépekről. Legyen t : Zt a 271 egy függvény, melyre minden n € zt 
esetén teljesül a t(ín) 2 n egyenlőtlenség. 


Definíció (t(n) időkortátos NTG ): 
Egy M nemdeterminisztikus Turing-gép t(n) időkorlátos, ha n hosszúságú inpu- 
tokon M minden számítási úr mentén legfeljebb t(n) lépést téve megáll. 
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Úgy is fogalmazhatunk, hogy egy tetszőleges n hosszúságú z € I input ese- 
tén a számításhoz rendelt fa magassága legfeljebb t(n) 4 1. A követelmény egy- 
aránt korlátozza az elfogadó és az elutasító számítási utak hosszát. Egy időkorlá- 
tos NTG tehát egyetlen számítási úton sem kerülhet végtelen ciklusba. A fejezet 
őjében említettük, hogy az NTG nem egy valósághű számítási model. A 
működésükben éppen ez a költségszámítás jelenti az igazán irreális tényezőt. Nem 
ismert (és a mai tudásunk szerint nem látszik lehetségesnek) olyan tényleges fizi- 
kai megvalósításuk, mely egy tín) időkorlátos NTG működését t(n)-nel arányos 
időben szimulálni tudná. (Olykor-olykor felröppenek sajtókacsák. állítva, hogy si- 
került igazi nemdeterminisztikus gépet konstruálni...) 

Az időkorlátos gép fogalmával a kezünkben a TIM E osztályok mintájára de- 
finiálhatjuk a nemdeterminisztikus időkorlátokkal kijelölt nyelvosztályokat. 


















Definíció: 
NTIM E(t(n)) :— (az O(t(n)) időkorlátos NTG-k által elfogadott nyelvek). 


NTG-k segítségével fogalmazható meg kényelmesen a számításelmélet egyik 
legérdekesebb nyelvosztályának, az NP -nek a definíciója. 


Definíció; NP :— Urx1 NTIM E(n?). 


Az NP nyelvosztály ugyanúgy épül fel az NTIM E(n") alakú nyelvhalma- 
zokból, mint a P a TIM E(n") alakúakból. A definíciók közötti nyilvánvaló for- 
mai hasonlóság alapján az NP osztályt a P nemdeterminisztikus megfelelőjének 
tekinthetjük. Az NP a nemdeterminisztikus polinom idejű Turing-gépekkel felis- 
merhető nyelvekből áll. Az egyszalagos (közönséges) TG-k felfoghatók NTG-nek 
is, sőt egy t(n) időkorlátos TG tekinthető t(n) időkorlátos NTG-nek is. Így azon- 
nal adódik, hogy TIM E(n?) c NTIM E(n?), amiből az egyesítésekre térve: 


Állítás: PC NP.O 


Az NP nyelvosztály tehát tartalmazza P-t, a hatékonyan kezelhető nyelvek osz- 
tályát. A két osztály, a P és az NP közötti analógia korántsem teljes. Nem ismert 
például, hogy az NP osztály megegyezik-e a coNP nyelvosztállyal (emlékeztetőül: 
coNP — (L € II VL € NP)). A témakörben dolgozó kutatók azt sejtik, hogy 
a két osztály különböző. Szintén nyitott kérdés, hogy P megegyezik-e NP-vel. Itt 
is a nemleges válasz látszik valószínűnek. A (P — NP?) kérdés a számításelmélet 
egyik legfontosabb megoldatlan problémája. 


Állítás: PC NPN.coNP. 
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Bizonyítás: P C NP miatt coP € coNP. Ezután az állítás azonnal adódik a P. — 
coP egyenlőségből. O 


Egyszerű alkalmazásként megjegyezzük, hogy a P — NP egyenlőségből NP — 
coNP következne. 


A nemdeterminisztikus számítások egy determinisztikus modellje 


Először megsejtesz valamit. Ne nevessetek, ez a legfontosabb lépés. 
Utána kiszámítod a következményeket... . RICHARD P. FEYNMAN 
a fizikai felfedezésekről 


Célunk itt nyelvek nemdeterminisztikus felismerésének determinisztikus modell- 
jét adni, Ezzel végső soron kényelmes eszközt kapunk nyelvek (feladatok) NP-be 
tartozásának igazolására, amely jól használható konkrét nyelvek esetén, 

Legyen M kétszalagos (közönséges) TG. Tegyük fel, hogy M inputja két rész- 
ből áll, egyik része — mondjuk z € 7" — az első szalagon van, a másik része y e P 
a másikon. Az utóbbi, az y-t tartalmazó szalag csak olvasható. Ezt nevezzük az M 
súgásszalagjának. 


input mg 
súgás(——T TV 


ee] 


A korábbi definícióval összhangban az M által felismert Ez nyelv azon (x,y) 
szópárok halmaza (r, y E T"), melyekkel a kezdő helyzetből elindítva M elfogadó 
állapotban áll meg. 





! 





! 





Definíció (nemdeterminisztikus felismerés ): Az M által nemdeterminisztiku- 
san felismert L nyelv a következő: 


nm € L akkor. és csak akkor, ha van olyan y súgás. hogy (z,y) € Li. 
Az M gép által nemdeterminisztikusan felismert L nyelvbe tehát pontosan 


azok az x € I" szavak tartoznak, melyek kiegészíthetők alkalmas y-nal (súgással) 
úgy. hogy az (x,y) párt az M elfogadja. Itt fontos mozzanat, hogy a jó súgás- 





íg 
nak csak a létezése követelmény. Semmit sem teszünk fel arról, hogy adott x-hez 
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miként található alkalmas y. Az y szót szokás még az r € L állítás tanújának, 
vagy az z elfogadásához vezető sejtésnek is nevezni. A stígás és sejtés szavak- 
ból kiszüremlő bizonytalanság arra hivatott utalni, hogy az y-nal szemben nincs 





A következő tétel szerint az NP-beli L nyelveknél az M egy polinom idejű TG 
és a tanú (súgás) hossza is polinomkorlátosnak vehető. 


Tétel (tanú-téteh: Egy L C I" nyelvre a következő két állítás egyenértékű: 

(a) L € NP. 

(b) Van olyan c 5 0 állandó, továbbá egy L1, € P nyelv, mely olyan (x,y) e (I)? 
párokból áll, hogy lyl £ lzlt ész € I" esetén z € L pontosan akkor, ha van 
y e I úgy, hogy (x,y) € Li. 


Bizonyítás: (Vázlat) (a) 5 (b) : Az L € NP feltétel miatt létezik egy n"! időkor- 
látos N NTG, mely felismeri Z-et. Tegyük fel, hogy N-nek egy lépésnél legfeljebb 
d elágazási lehetősége van, vagyis d a ő(g,a) halmazok maximális elemszáma, 
Egy c 5 0 szám és egy olyan M polinomkorlátos TG létezését kell megmutat- 
nunk, mely (2, y) alakú inputokkal dolgozik, és z € L pontosan akkor teljesül, ha 
van olyan y € I", lyul £ Iz]", hogy (z,y) € E — Lm. 

Legyen z € L, lxi — n. Erre az inputra egy olyan y — yiy2:": Um alakú 
sorozatot (m £ n"1) fogunk jó súgásnak tekinteni, mely az N egy elfogadó szá- 
mitási útját írja le az z input mellett. Az y; (bináris) szavak 1 és d közé eső egészek 
kódjai, amiből Íy] £ n" f[ogyí(d 4 HD] £ n" alkalmas c konstanssal. Az y; által 
ábrázolt szám mondja meg, hogy a j-edik lépésben N melyik lehetséges lépését 
keli választani (az adott helyzetben szóba jövő legfeljebb d lehetséges lépés közül) 
az elfogadó számítási úton. Az M TG egy . nagy" lépése a következő: a súgássza- 
tagról megnézi, hogy N melyik lépését ketl megtenni (ez legfeljebb [Iogo(d 4-1)! 
bitet jelent), majd ezt meglépi, Ez N -től függő konstans időben megtehető. Az M 
pontosan akkor álíjon meg, ha N szímulált , lépése" megállás, fogadja el az inpu- 
tot, ha ez a megállás A elfogadó állapotában történt. Az M álljon meg elutasít 
állapotban akkor is. ha a súgás következő darabja nem értelmezhető N legális lé. 
péseként. A fentiek alapján M az (x,y) összetett input hosszában lineáris ideig 
működik. Világos az is, hogy a € L esetén van olyan jó y súgás, melyre iv £n" 
Ha viszont a £ L, akkor (z,y) £ La — Lm tetszőleges y € I"-ra. Ekkor ugyani: 
az (x,y) párt M vagy azért utasítja el, mert y nem kódja N legális számításának 
vagy pedig azért, mert y elutasító számítási út kódja: elfogadóé nem lehet, hiszer 
elfogadó út nem létezik. 

(b) - (a) : Egy x € L inputhoz a feltétel szerint van rövid tanú (súgás): hi 
Iz] — n, akkor van olyan legfeljebb n" hosszúságú y, hogy (x,y) € Li. Az ilyet 
rövid jó súgások száma legfeljebb C 27". Megmutatható, hogy ennyi lehetőséi 
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nemdeterminisztikusan n" lépésben végignézhető. Ezt ittnem részletezzük (de a 
következő feladatban körvonalazzuk). 0 


Feladat: Tegyük fel, hogy az M egy n" időkorlátos TG, mely a tételbeli L1 nyel. 
vet ismeri fel. Ebből készítünk egy N NTG-t a következők szerint. Az N állapotai 
egyezzenek meg az M állapotaival, elfogadó (elutasító) állapotai az M elfogadó 
(elutasító) állapotaival, Az N-nek legfeljebb két lehetséges lépése lesz a g állapot. 
ban és az a szalagjel olvasásakor. Ezek legyenek azok a lépések, melyeket M tesz 
abban a két esetben, amikor 

M állapota a, az inputfej alatti jel a, a súgásfej alatti jel 0; 

M állapota a, az inputfej alatti jel a, a súgásfej alatti jel 1. 

Természetesen N-nek csak egy szalagja van, így az M lépéseiből csak az állapot- 
változtatást és az input szalaggal kapcsolatos teendőket az állapotváltoztatást és az 
input szalaggal kapcsolatos teendőket ket! megtenni. Bizonyítandó, hogy N éppen 
L-et ismeri fel, és n" időkorlátos. 


Megjegyzések: 1. A (b) állításban az ly] c Il" feltétel helyettesíthető az 
Iul — Iz]" feltétellel. Ugyanis egyrészt feltehetjük, hogy c egész; ha kell, helyette- 
síthetjük fe)-vel. Másrészt egy y tanút kiegészíthetünk a végére ragasztott tetsző- 
leges bitekkel, hogy a hossza éppen [g]" legyen, 

2. A tanú-tételből következik, hogy NP C PSPACE. Legyen ugyanis L € NP, z 
egy input szó, Ix] — n. A legfeljebb n" hosszú y e Tf" szavakat mint tanújelölte- 
ket sorban generáljuk, és minden (7, y) szópárra lefuttatjuk M-et, egészen addig, 
amíg vagy elfogadó számítást kapunk (ekkor z € L), vagy elfogynak a lehetséges 
jelöltek (ekkor z £ L). Ez minden egyes y szóra O(n") időt jelent, Ha egy y szó- 
val végeztünk, akkor a kapott részeredményeket eldobhatjuk, és kezdhetjük az M 
számítását elölről a következő tanújelölttel. A szükséges adminisztráció megold- 
ható egy n" bites számláló segítségével. Az n" hosszú tanújelölteket tekinthetjük 
úgy, mint n" bites (binárisan ábrázolt) számokat. A tanújelöltek szisztematikus 
végignézése azt jelenti, hogy nullától 277 — 1-ig végiglépkedünk az egészeken. 
mindig az eggyel nagyobbat véve. Abban a kellemes - és igen egyszerű — helyzet- 
ben vagyunk, hogy ehhez a lépkedéshez nem kell sok memória. A következő szám 
(tanújelölt) könnyen és gyorsan megkapható pusztán az előző ismeretében. 









Az eddíg megismert bonyolultsági osztályok tartalmazási viszonyait szemlél- 
teti a következő vázlat. 
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EXPTIME 





Nem tudjuk, hogy a P osztály valódi része-e a PSPACE osztálynak. A sejtés a 
korábbiakkal összhangban az, hogy igen. Az eddig vett nyitott kérdések közül ez 
a leggyengébb, amint azt az alábbi egyszerű következtetési lánc mutatja: 


NP 5 coNP 5 P £ NP 5 PSPACE éP 


Egy , kép" az NP-beli nyelvekről: 


A tanú-tétel determinisztikus jellemzése az egyik leghasznosabb eszköz nyelvek 
NP-be tartozásának belátására. Gondolva a polinom idejű számítások robusztussá- 
gára is, az L1 nyelvről (döntési problémáról) elég látni, hogy kezelhető polinom 
idejű , programmai". Nem kell a nehézkes TG-modellel dolgozni. 

Az NP nyelvosztály determinisztikus leírásának elemeit segíthet megjegyezni 
az alábbi táblázatban vázolt helyzet. 











Bíró: M polinom idejű algoritmus (pl. TG, RAM program) 
Vádlott zE€I 

"Tanú: ver, lyi S Iz" 

Vád: Az állítás, miszerint z € L. 





Az M algoritmus (a kissé türelmetlen bíró, akinek időkorlátja van) nem tesz 
mást, mint ellenőrzi, hogy az y tanú(vallomás) tényleg bizonyítja-e a vádat, ami az 
a € L állítás. A tétel La nyelve azon (vádlott, tanú) párokból áll, amelyeknél a bíró 
szerint a tanú bizonyítja a vádlortról a vádat. Nem ket! foglalkoznia a bizonyíték 
előtalálásával. Ez — a mai tudásunk szerint — sok érdekes esetben nem is tehető 
meg polinom időben. Csak az eléje tárt bizonyíték helyességéve! kell törődnie. Ezt 
a szemléletet fogjuk használni a következő példáknál. 


262 8. AZ NP NYELVOSZTÁLY 


8.4. Néhány NP-beli nyelv 


8.4.1. 3 színnel színezhető gráfok 


Rögzítsük gráfok egy nem túl pazarló kódolását bitsorozatokkal. Például egy 
n szögpontú (irányított, vagy irányítatlan) gráf adjacencia-mátrixát tárolhatjuk 
egy n? hosszúságú bitsorozatként. Egy ilyen kódolás eredményeként a gráfokat 
£0,1)"-beli szavak reprezentálják, gráfok halmazainak pedig nyelvek felelnek 
meg. Emlékeztetőül: a G — (V, E) gráf k színnel színezhető, ha a csúcsaihoz i 
egészeket (színeket) rendelhetünk úgy, hogy 1 £ i £ k, és ha (v, w) € E, akkor v 
és w különböző színűek, Legyen 3-SZÍN a 3 színnel színezhető gráfok kódjaiból 
álló nyelv. 


Állítás: 3-SZÍN € NP. 


Bizonyítás: Elegendő megmutatni, hogy a három színnel való színezhetőségnek 
van rövid és hatékonyan ellenőrizhető tanúja. Egy n szögpontú 3 színnel színez- 
hető G gráf jó színezése alkalmas tanú lesz. Egy ilyen színezés leírható 2n bittel 
(például legyen 01—piros, 10-—sárga, I1—zöld). A bíró ellenőrzi, hogy az adott 
színezés jó-e. Ez a feladat polinom időben megoldható. 

A tanúttétel alkalmazásakor a G gráf felel meg az z inputnak, a színezés az 
y tanú. Az L4 nyelv (G, színezés) alakú párokból áll, ahol a színezés egy helyes 
3-színezése G-nek. A bírót jelentő M algoritmusnak csak annyit kell tudnia, hogy 
ellenőrzi a két komponens harmóniáját: hogy a javasolt színezés tényleg jó-e. 

Figyeljük meg, hogy tényleg teljesülnek a tanú-tétel (b) részének a követelmé- 
nyei. Ha G € 3-SZÍN, akkor van (G, színezés) alakú pár L1-ben. Ha G € 3-SZÍN, 
akkor pedig nem létezhet ilyen pár. 2 


Feladat: Adjunk O(n? log n) logaritmikus költségű RAM programot, mely meg- 
oldja a bíró feladatát: adott n szögpontú G gráfra és a csúcsok egy adott színezé- 
sére eldönti, hogy utóbbi 3 színezése-e G-nek. 


8.4.2. . Hamilton-körrel rendelkező gráfok 


AG irányítatlan gráf egy köre Hamilton-kör, ha abban G minden csúcsa pontosan 
egyszer szerepel. Legyen H a Hamilton-kört tartalmazó gráfokból álló nyelv. 


Állítás: H e NP. 


Bizonyítás: A G € H állításnak rövid tanúja egy Hamilton-kör. A Hamilton-kör 
leírható a csúcsoknak a kör mentén való bejárási sorrendjével, ami O(nlogn) 
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bitet jelent, ha G-nek n csúcsa van. A bíró nyelve (Z1 a tanú-tételben) 
(G; [vi va, . . . , vn]) alakú párokból áll, ahot a (vi, v2, . . . , va) Hamilton-köre a G 
gráfnak. A bíró dolga egyszerű: ellenőrzi, hogy tényleg a G köre-e a tanú, és hogy 
G minden csúcsa pontosan egyszer szerepel-e a listán. Ezek a feladatok polinom 
időben megoldhatók. 0 


Feladat: Adjunk minél hatékonyabb RAM programot a bíró feladatának megol- 
dására. 
AG irányított gráf egy irányított köre Hamilton-kör, ha abban G minden csú- 


csa pontosan egyszer szerepel. Legyen IH az irányított Hamilton-kört tartalmazó 
irányított gráfok nyelve. Az előzőekhez hasonlóan látható, hogy IH € NP. 


8.4.3.  Síkba rajzolható gráfok 


Egy gráf síkba rajzolható, ha a pontjainak kölcsönösen egyértelműen megfelel- 
tethetők síkbeli pontok, az éleknek pedig a megfelelő csúcsokat összekötő egye- 
nesszakaszok úgy, hogy a különböző szakaszok legfeljebb csak a végpontjaikban 
találkozhatnak. Legyen Sík a síkba rajzolható gráfok nyelve. Mint látni fogjuk, 
ennek a nyelvnek a komplementere is NP-beli. Az ilyen nyelvek esetén annak a 
ténynek is van rövid és hatékonyan ellenőrizhető tanúja, hogy egy input szó nem 
tartozik a nyelvbe. 


Definíció (jól karakterizált nyelv): Az L C I" nyelv jól karakterizált, ha L € 
NP na coNP. 


Állítás: A Sík nyelv jól karakterizált. 


Bizonyítás: Egy gráf síkba rajzolhatóságának a tanúja egy síkba rajzolás. (Meg- 
mutatható, hogy ha G € Sík, akkor van a G-nek olyan síkba rajzolása is, ahol a 
pontok koordinátái [V(G)I-nél nem nagyobb természetes számok). A síkba raj- 
zolás helyességét könnyű ellenőrizni. Lényegében végpontjaikkal adott szakaszok 
metszéseit kell számolni. Ezzel beláttuk, hogy Sík € NP. 

A Sík € coNP állítás igazolásához azt kell megmutatni, hogy a G € Sík tény- 
nek ís van hatékonyan ellenőrizhető tanúja. Ez pedig következik K. Kuratowski 
nevezetes tételéből : a G gráf nem síkba rajzolható 5 G topologikusan tartalmaz 


teljes ötszöget vagy 3 ház — 3 kút gráfot. 


teljes ötszög 3 ház — 3 kúl 
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AG g Sík ténynek egy G-beli topologikus teljes 5-ös vagy 3 ház — 3 kút 
gráf lehet a tanúja. A tanú tehát a tiltott részgráfot kijelölő 5 vagy 6 pontból áll és 
az ezek közül a megfelelőeket összeköt zös belső pontot nem tartalmazó G- 
beli utakból. A bírónak csupán a megfelelő pontpárok közötti utak meglétét kell 
ellenőriznie, és még azt, hogy az utak diszjunktak. Ezek egyszerűen és gyorsan 
verifikálhatók. 0 





Megjegyzések: 1. Valójában a Kuratowski-tételből az erősebb Sík € P állítás is 
következik. A síkgráfok tehát polinom időben felismerhetők. Ezen felül a síkba 
rajzolásra is van hatékony algoritmus. Ezeket az állításokat nem részletezzük. 

2. Szigorúan véve a Sík nyelv komplementere nem pontosan a síkba nem rajzolható 
gráfokból áll. A komplementer nyelvbe tartoznak még azok a szavak is, melyek 
nem kódjai gráfoknak. Ezekről azonban feltehetjük, hogy könnyen felismerhetők. 
Arról van csupán szó, hogy értelmes kódolást választottunk, aminél nem okoz gon- 
dot a hibás kódok felismerése. Ezt ftgyelembe véve a Sík € coNP állítás érdemi 
része tényleg az, hogy a síkba nem rajzolhatóságnak van hatékony tanúja. 


Itt elgondolkodhatunk egy kicsit azon, hogy a 3-SZÍN és a H nyelvek ho- 
gyan viszonyulnak a coNP osztályhoz. Van-e annak rövid és hatékonyan ellenő- 
rizhető tanúja, hogy egy gráf nem színezhető 3 színnel, illetve, hogy nem tartal- 
maz Hamilton-kört? Ilyen tanúk nem ismeretesek, és a szakértők úgy sejtik, hogy 
nem is léteznek. Ha igazuk van, akkor ezek a nyelvek mutatják az NP és a coNP 
osztályok különbözőségét. 

Itt ismét visszautalunk Merlin szerencséjére az első fejezetből: a házasítási 
feladat megoldhatatlanságának volt rövid, a király által is gyorsan átlátható bí- 
zonyítéka (egy király legfeljebb polinom időt hajlandó ilyesmire pazarolni). Egy 
König-akadály a megoldhatatlanság gyors bizonyítéka. A varázsló nem lenne ilyen 
könnyű helyzetben, ha arról kellene Arthurt meggyőznie, hogy egy nagy gráfban 
nincs Hamilton-kör. Az NP-beli feladatok éppen azok, ahol az igenlő válasz esetén 
a varázsló elkerülheti a türelmetlen király haragját. 

A gráfalgoritmusokról szóló fejezetben találkoztunk néhány minimax tétellel 
(Ford-Fulkerson, Menger, König). Az ilyen eredmények gyakran hordozzák azt az 
algoritmikus jelentést, hogy a megfelelő nyelv jól karakterizált. Példaként nézzük 
a Ford-Fulkerson-tételt; a másik kettő meggondolását az olvasóra hagyjuk. 


Feladat: Álljon a Folyam nyelv azon (H,k) alakú párokból, amelyekre H — 
(G,s,t,c) egy egész kapacitásokkal rendelkező hálózat, k € Zt, és H-ban van 
olyan f folyam, aminek az értéke legalább k. Mutassuk meg, hogy Folyam € 
NP N coNP. (Legyen x € I". Az z € Folyam tény tanúja egy 9£-beli f folyam, 
melyre If1 2 k; z £ Folyam tanúja pedig egy 9£-beli vágás, aminek a kapacitása 
kisebb, mint A.) 
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Megjegyezzük, hogy a feladatban foglaltnál erősebb Folyam € P állítás is 
igaz; Dinic módszerével polinom időben találhatunk egy 7£-beli f" maximális fo- 
lyamot. Nyilvánvalóan (H, k) € Folyam egyenértékű azzal, hogy [ff] 2 k. 


8.4.4. A prímszámok nyelve 


Ap 2 legész szám prímszám, ha a pozitív egészek közül csak az ! és p számokkal 
osztható maradék nélkül. A p 5 1 egész szám összetett szám, ha nem prímszám. 

Jelölje II a (binárisan ábrázolt) prímszámok nyelvét. Itt a komplementer tulaj- 
donságnak, az összetettségnek van egyszerű tanúja. Ha m összetett szám, akkor 
eztegy k valódi osztója (i c k a m) tanúsítja. A k ismeretében m összetettsége 
az m : k osztás elvégzésével igazolható. Tegyük fel, hogy m egy n-bites szám 
(az input hossza n). Az elemi iskolából ismert osztó algoritmussal az m : k osztás 
0(n?) bit-művelettel elvégezhető. Van tehát polinom idejű bíró. Ezzel beláttuk, 
hogy IT € coNP. Lényegesen bonyolultabb a következő állítás. 


Tétel (V. R. Pratt, 1975): H c NP (rehát II jól karakterizált), 
Pratt tételének bizonyításához szükségünk lesz egy számelméleti lemmára. 


Emlékeztetőül: a — b (mod m) jelöli azt a tényt, hogy b — a osztható m-mel 
(a,b,m egész számok). 





Lemma: Legyen p 72 2 egy egé. ím. A p pontosan akkor prímszám, ha van 
olyan 1 £ g — p egész, melyre teljesülnek az alábbiak: 


1.99! z1 (mod?p), 


2. 97 1 (mod p) minden r prímszámra, melyre rIp — 1. 


A lemma bizonyítását mellőzzük. A számelmélet elemeiben jártas olvasó szá- 
mára megjegyezzük. hogy g a modulo p maradékosztályok multiplikatív csoport- 
jának egy generátoreleme (ún. primitív gyök). 

Szükségünk lesz még a gyors hatványozás algoritmusára. Ez egy ősrégi ötle- 
ten! alapul, és fontos építőköve a számítógépes aritmetikának. Gyors hatványo- 
zással egy a"" alakú hatvány (m egy pozitív egész) legfeljebb 21oga m szorzás- 
sal kiszámítható. Írjuk fel ugyanis az m kitevőt kettes számrendszerben m — 


!Az i.e. 1650 táján íródott egyiptomi Rhind-papirusz szorzás helyett összeadással, vagyis a hat- 
ványozás helyett a szorzás elvégzésére ismerteti a módszert. 
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ep. e12! 4 e222 4... 4 ex2t, k £ loga m és ez € (0,1). Számítsuk ki ismé- 
telt négyzetre emelésekkel sorra az a?" hatványokat j — 1, 2, . . . ,k. Ez k szorzást 
jelent. Végül szorozzuk össze az a? hatványokat azokra a j értékekre, melyekre 
e; — 1. Ez legfeljebb k további szorzást igényel. Úgy fogalmazhatunk, hogy a 
szorzások száma polinomiális (sőt lineáris) az m kitevő méretében. Ha a egész 
szám, akkor az a" végeredmény mérete exponenciális is tehet a méretéhez ké- 
pest. Nem ilyen rossz a helyzet, ha a gyors hatványozást a?(mod mi) alakú mara- 
dékosztályok kiszámítására használjuk, Ezt a feladatot moduláris hatványozásnak 
nevezik. Ekkor minden egyes szorzás után redukálhatjuk a szorzatot modulo mi. 
Ha itt a és mi legfeljebb 72-bites számok, akkor a számítás során fellépő egészek 
hossza legfeljebb 2n bit lesz. A gyors hatványozás tehát polinom idejű algorit- 
must ad a moduláris hatványozás feladatára (binárisan ábrázolt a, m, ma bemenet 
esetén). 


Pratt tételének bizonyítása: Olyan tanút kell javasolnunk, amelynek birtokában 
hatékonyan igazolható, hogy az inputként adott p prímszám. Próbáljunk a lemma 
által sugallt úton járni: adott g szám, valamint a p — 1 egész ri, . . . , ra prímosztói 
ismeretében gyors hatványozással ellenőrizhetők a lemma köngruencia-feltételei. 
Első közelítésben a g és az Ti, . . . ,"x számokat tekintjük tanúnak. Tanúsítanunk 
kell még, hogy r1,...,Tx éppen a p — 1 prímosztói. Ennek a könnyebbik része 
ellenőrizni, hogy p — 1 előáll-e az r; számok hatványainak szorzataként. Tanúsí- 
tani kell ezen kívül, hogy az r; számok is prímek. Ezekhez ugyanolyan szerkezetű 
tanút használunk, mint a p-hez. Például az ri-hez szükségünk lesz egy alkalmas 
91 számra, valamint az rja — 1 prímosztóira és azok tanúira is. Ez tehát egy rekur- 
zíve megadott szerkezetű tanú lesz. Megmutatható, hogy ha a p input egy n bites 
szám, akkor az így felépített tanú összmérete 0(n?), és a bíró algoritmusa n-ben 
polinomiális idejű. J 








Megjegyzés: Nyitott kérdés, hogy IT € P teljesül-e, azaz van-e polinom idejű 
módszer a prímtulajdonság (összetettség) eldöntésére. Ha a válasz nemleges, akkor 
P £ NP fi coNP. A legjobb ismert prímfelismerő módszer (L. M. Adleman, €. 
Pomerance, R. S. Rumely, 1983) futási ideje n bites input esetén n"19él08 7. 


8.4.5. . A felismerés és a keresés kapcsolata (prímtényezős felbontás) 


A nyelvfelismerési problémák olyan feladatoknak felelnek meg, amelyeknél a vá- 
lasz egyetlen bittel (igen-nem) kifejezhető. Gyakrabban találkozunk olyan prob- 
lémákkal, amikor a várt eredmény összetett, például amikor egy mennyiség optí- 
mumát kell meghatározni, vagy egy halmaz adott tulajdonságú elemeit kell megke- 
resni. Ezeket az általánosabb feladatokat szokásos (bár nem túl pontos) szóhaszná- 
lattal keresési feladatoknak nevezik. A keresési feladatokat felfoghatjuk valamely 
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f: TIT c P függvény kiszámításának problémájaként. Gyakran előfordul, hogy 
f számítása hatékonyan visszavezethető egy felismerési problémára (egy nyelv 
felismerésére). Erre a jelenségre szeretnénk egy példát mutatni a következőkben. 

Álljon az F nyelv azokból az (a, e) pozítív egész párokból, melyekre igaz, 
hogy a-nak van c-nél nem nagyobb valódi osztója: 





F- (69 





1€€£ a egészek és vanolyan I cb £ c egész, 
melyre b osztója a-nak 7 


Állítás: F € NPNcoNP. 


Bizonyítás: Az (a,c) € F ténynek egy jó b érték lesz a tanúja. A bíró ellenőrzi, 
hogy b osztja-e a-t, ésaz 1 c b £ c egyenlőtlenségeket, Az (a,c) € F ténynek 
alkalmas tanúját adják az a prímtényezős felbontásában szereplő pi , . . . p prímek, 
valamint a p; számok prímtulajdonságának tanúi (Pratt tétele). A bíró ellenőrzi, 
hogy a pi; számok prímek-e, a előáll-e ezek hatványainak szorzataként, és végül, 
hogy teljesülnek-e a c c pi egyenlőtlenségek. 0 





A kapcsolódó keresési feladat a prímtényezős felbontás problémája: egy bi- 
nárisan adott a egésznek keressük a prímosztóit. Ez egyike a legtöbbet vizsgált 
algoritmikus kérdéseknek. Hatékony algoritmus kidolgozásával már Legendre és 
Gauss is foglalkoztak — a cél felől tekintve nem sok sikerrel. Ezekből a kutatások- 
ból sok fontos és szép számelméleti eredmény született, de polinom idejű módszert 
máig sem sikerült találni. Az eddigi leggyorsabb algoritmus D. Shanks törpe lé- 
pés - óriás lépés módszere; ennek időigénye n bites inputon c27/4. A következő 
állítás szerint szoros összefüggés van az F és a prímtényezős felbontás algorit- 
mikus nehézsége (bonyolultsága) között. Ha F hatékonyan felismerhető, akkor a 
prímtényezős felbontás problémája is hatékonyan megoldható. 








Tétel: Ha F € P igaz tenne, akkor (prímtényezős felbontás) € FP is igaz lenne. 


Bizonyítás: Meg fogjuk mutatni, hogy ha van gyors (polinom idejű) E eljárá- 
sunk F felismerésére, akkor ennek segítségével polinom időben megtalálhatjuk az 
a input egész prímtényezőit. Először az E eljárás egy hívásával teszteljük, hogy 
(a,a — 1) € F teljesül-e. Ha nem, akkor megállhatunk, mert a prím, hiszen nincs 
1-től és a-tól különböző pozitív osztója. Ellenkező esetben bináris kereséssel meg- 
határozzuk a legkisebb olyan c értéket, melyre (a,c) € F. Ez az E legfeljebb 
log; a számú hívásával megoldható. Először az (a, [a/2]) párt teszteljük, ha ez 
F-beli, akkor megyünk tovább lefelé, stb. A kapott c egész nyilvánvalóan az a leg- 
kisebb prímosztója; különben c nem volna minimális. Ezután az a 4 § értékkel 
ismételjük a fenti eljárást. 
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Az a egy prímosztóját így O((loga a)?) időben leválasztjuk, ahol d 5 0 
egy állandó, hiszen a feltétel szerint egy E-hívás időigénye polinomiális az input 
hosszát jelentő log a-ban. Végeredményben az a összes prímosztóját megkapjuk 
O((log ajét!) költséggel, mert a prímosztók száma legfeljebb log; a. 0 


Megjegyzés: Valójában nem ismert polinom idejű módszer az F nyelv felismeré- 
sére. A szakértők közül sokan úgy vélik, hogy F € P. Ebből következne, hogy 
P ZÁ NPN coNP. Ennek a negatív ténynek, mármint hogy egy feladatra mincs 
hatékony módszer, fontos alkalmazásai vannak a biztonságos (titkos) kommuniká- 
ció területén. Vannak olyan kommunikációs protokollok, amelyeknél az üzenetek 
megfejtésének feladata összehasonlítható az F felismerésének feladatával. Ha a 
rendszer titkos kulcsait nem ismerő kívülálló meg tudná fejteni az üzeneteket, ak- 
kor F-et ís kezelni tudná. A következő ábra az F nyelv (vélt) helyét mutatja a 
bonyolultsági osztályok térképén. 





8.5.  Karp-redukció, NP-teljesség 


Az F nyelv és a prímfelbontás kapcsolatának taglalásakor tulajdonképpen össze- 
hasonlítottuk a két feladatot. Az eredmény úgy is fogalmazható, hogy a prímfel- 
bontás problémája - polinom idejű extra munka erejéig - nem nehezebb, mint az 
F nyelv felismerése. Azt is mondhatjuk. hogy a prímfelbontás feladatát visszave- 
Zettük F felismerésének a feladatára. A kapott felbontó algoritmus futása során 
többször hívtuk az E eljárást. Most egy ennél szigorúbb visszavezetésfogalmat 
adunk meg. 


Definíció: Az f : I" 6 I" leképezés az La C I" nyelv Karp-redukciója az 
E. CI nyelvre, ha 

I. Tetszőleges xz € I" szóra z € L4 pontosan akkor teljesül, ha f(x) € Ez: 

2. f c FP, azaz f polinom időben számítható. 


8.5. KARP-REDUKCIÓ, NP-TELIESSÉG 269 


A továbbiakban Li - L; jelöli azt a tényt. hogy L1-nek van Karp-redukciója 
L2-re. A definíció első követelménye azt fejezi ki, hogy f hűségesen transzfor- 
málja a nyelvbe tartozást. Ha z € It benne van L4-ben, akkor fíz) benne lesz 
L2-ben; és fordítva: ha z nincs £1-ben, akkor f(x) sincs L2-ben. A második kö- 
vetelmény szerint az f transzformáció gyorsan számítható. Van olyan csak az f-től 
függő c 5 0 állandó, hogy az f(2) szó Iz)" tépésben megkapható x-ből. Ennek fo- 
Iyománya például, hogy f(z) nem lehet túl hosszú: [f(x)I £ lel". 
redukcióval az Li felismerésének a problémáját visszavezetjük az 
L2 felismerésének a problémájára. A Karp-redukció jelentős segítséget ad, hogy 
eligazodhassunk az NP-betli nyelvek dzsungelében. Elsősorban annak a megálla- 
pítására használható, hogy egy nyelv (döntési feladat) nehéz. A jellemző alkalma- 
zási helyzetben egy eddig ismeretlen L" nyelvet hasonlítunk e egy már ismert 
(mondhatni: hírhedt) L nyelvvel. Egy L - L" Karp-redukció arra enged követ- 
keztetni, hogy L/" nehéz nyelv, feltéve, hogy ez igaz L-re. Ezt alapozza meg a 
következő állítás. Látni fogjuk, hogy L4 -— La esetén Lz hatékonyan felismerhető, 
ha van hatékony módszerünk L2 felismerésére. Az utóbbi eljárást egy inputra csak 
egyszer kell hívni. Egy La - L2 redukció létezéséből arra következtethetünk. 
hogy L2 felismerése — polinom idejfi extra munka erejéig — legalább olyan nehéz, 
mint L1-é. 

Első példaként ismertetünk egy Karp-redukciót az irányított Hamilton-kört tar- 
talmazó gráfok nyelvéről az irányítatlan esetre. Egy olyan ötlet lesz segítségünkre, 
mellyel az irányított élek kódolhatók irányítatlan élekkel. 









Állítás: IH - H. 


Bizonyítás: Legyen G — (V, E) egy irányított gráf. Ebből egy G! — (VE) 
irányítatlan gráfot készítünk úgy. hogy G ismeretében G" gyorsan megépíthető 
legyen: továbbá G-ben pontosan akkor legyen irányított Hamilton-kör, ha G"-ben 
van irányítatlan Hamilton-kör. 


utat: Ve — Va — Vki. AZ u — v € E élnek feleltessük meg az ur; — vie élet. 
Formálisan: 


V" - (vev uilveVh 
E - ((veve),(v..vr) IvE VI (Curve) le 9 v€ E) 
Ha G-nek n csúcsa és e éle van, akkor G"-nek 3n csúcsa és 2n 4 e éle lesz. Világos, 


hogy G ismeretében G" polinom időben, azaz (ín -k e)" lépésben megkapható. A 
Karp-redukció második (hatékonysági) követelménye tehát teljesül. 
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Nézzük most az első feltételt. G minden F irányított Hamilton-körének termé- 
szetesen megfeleltethető G" egy F" Hamilton-köre. Az F egy u — v élének az F"- 
ben az 4, — 4 — Ve — 0, út felel meg. Ha tehát G € IH, akkor G" € H, A fordított 
irányú követelményhez tegyük fel, hogy G"-ben van egy F" C E" Hamilton-kör. 
Járjuk be ezt a kört egy csillagos pontjából kezdve úgy, hogy a ki indexű szomszéd 
felé lépjünk először. Ekkor a körön a bejárás szerint szomszédos két csillagos pont 
közötti útdarab csak u, — Ur; — Vpe — v, alakú lehet, Ebből pedig azonnal adódik, 
hogy az 

Fz (u ol (usw) eF) 


élhalmaz irányított Hamilton-köre (G-nek. A G — G" megfeleltetés tényleg Karp- 
redukció. DO 


AG a G! leképezést szemlélve elmondhatjuk, hogy IH felismerése nem ne- 
hezebb, mint a H nyelvé. Az IH egy G bemenetéből a leképezéssel olcsón kap- 
hatjuk a H feladat G" bemenetét. Ha a (G" € H?) kérdést meg tudjuk válaszolni, 
akkor megkaptuk a választ a (G € IH?) kérdésre ís. Most pedig nézzük mindezt 
általánosabban. 


Állítás: 

1. Ha Ea A Lo és La € P, akkor I € P. 

2. Ha L4 A La és L2 € NP akkor L1 € NP. 

3. Ha L - Lovakkor Da A Da, ahol E. ENEa 

4. Ha Li A L2 és La € coNP, akkor L1 € coNP. 

5. Ha La - IL és La € NPOcoNP, akkor L4 € NPN coNP. 


Bizonyítás; Legyen f : I" o I" az Li Karp-redukciója La-re. A definíció szerint 
f € FP, mondjuk f € FTIME(n!). Jelöljön az z € I" egy input szót, melyre 
szeretnénk eldönteni, hogy r € Li tefjesül-e, és legyen n az g hossza. Vegyük 
ezután sorra az állításokat, 

1]. A célunk itt az, hogy polinom idejű algoritmust adjunk az Li felismerésére. 
Az f függvény mellett még használhatjuk az L2 € P feltételt, mondjuk legyen 
L. € TIM E(n)). Először kiszámítjuk az f(x) szót, ennek időigénye legfeljebb 
eint, amiből [f(2)I £ ein? is következik. A második lépésben L2 felismerő al- 
goritmusával eldöntjük, hogy f(x) € La igaz-e. Ennek az időigénye legfeljebb 
cx(cinyy. A Karp-redukció 1. tulajdonsága szerint az (x € L1?) kérdésre adandó 
válasz megegyezik az (f(x) e L2?) kérdésre adott válasszal, tehát az x inputot 
pontosan akkor fogadjuk el, ha a második lépésben f(z)-et elfogadtuk. A számí- 
tás összideje O(n"!), Ezzel igazoltuk, hogy Li € P. 

2. Az f(x) € La tény egy y tanúja megfelelő lesz az z € Li tanújának is, és az 
L2-höz tartozó bíró egy kis módosítással jó lesz az Za bírójának is, Ha ugyanis 
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Iyl £ If(x)i", akkor [yj £ eflzlfs, tehát y az x-hez képest polinomiális méretű. 
Az Li bírója az (x,y) bemenet esetén először kiszámítja f(m)-et, majd átadja az 
(f(z),y) párt az La bírájának. Az Li bírója pontosan akkor fogadja el az (x,y) 
párt, ha az La bírója elfogadja az (f(x), y) párt. Ez a Karp-redukció definíciója 
szerint éppen azt jelenti, hogy z € L1. Az is világos, hogy L1 bírójának az időigé- 
nye becsülhető n egy polinomjával. 
3. Az La - La redukciót megval, f jó, hiszen a definíció 1. követelménye 
így is fogalmazható: tetszőleges z € I" szóra v £ Li pontosan akkor teljesül, ha 
f(2) g La. 

4. Közvetlenül adódik az előző két állításból. 

5. A 2. és a 4. állítások következménye. 





A megelőző állítások szerint ha La benne van valamelyik nevezetes P-t tartal- 
mazó nyelvosztályban, akkor La is. Ez érvényes a PS$PACE és EXPTIME osztá- 
lyokra is; az első állítás gondolatmenete működik ezekben az esetekben is. 


Feladat; Igazoljuk, hogy a - reláció tranzitív; ha La - La és La 7 Ls, akkor 
Ia - L3 ís teljesül. 

A Karp-redukció fogalma lehetőséget ad arra, hogy könnyebb-nehezebb vi- 
szonyt állapítsunk meg nyelvek között, Az NP osztály egyik érdekes tulajdonsága, 
hogy vannak benne ilyen értelemben legnehezebb nyelvek (feladatok). Ezek az 
NP-teljes nyelvek. 


Definíció: Az L C I" nyelv NP-treljes, ha 
1.LENP 
2. tetszőleges I" € NP nyelv esetén létezik I" - L Karp-redukció. 


Egy NP-teljes nyelv tehát legalább olyan nehéz, mint bármely más NP-beli 
nyelv. Ha egy ilyen nyelvről kiderülne, hogy P-beli (colNP-beli), akkor ugyanez 
igaz lenne minden NP-beli nyelvre. Az NP-beli nyelveknek és A megfelelő 
(tanú)keresési feladatoknak a kapcsolata miatt az NP-teljes nyelveket szokás még 
univerzális kereső feladatoknak is nevezni. A P £ NP sejtés szellemében úgy gon- 
doljuk, hogy az NP-teljes nyelvekre nem léteznek polinom idejű felismerő mód- 
szerek. Ez nem bizonyított tény, de i mennyiségű közvetett bizonyíték szól 
mellette: a gyors algoritmusokat kereső kísérletek egyhangú kudarca. Ilyen érte- 
lemben az NP-teljes feladatok nehézségét a tudomány mai állása mellett rapasz- 
talati rénynek tekintjük. Azt is hangsúlyozzuk, hogy az NP-teljes feladatok nem 
megoldhatatlanok. Korábban láttuk, hogy 


NP C PSPACE C EXPTIME, 


tehát az NP-beli problémák legnehezebbjei is legyűrhetők exponenciális idejűnél 
nem rosszabb algoritmussal. 
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8.6. ASAT nyelv és a Cook-Levin-tétel 


Fiam, tanácsolom tehát, 
próbáld először a logikát. 


hogy ezután már ne ingatag 

járja útját a gondolat, 

fel s le bolvongva botorul, 

tidércként keresztül-kasul. 
JOHANN WOLFGANG GOETHE 
(Mefisztó tanácsai a Diáknak.) 


A következőkben egy alapvető fontosságú NP-teljes nyelvet ismertetünk. Szüksé- 
günk lesz ehhez a 800le-formula fogalmára. Egy Boole-formula a 0 (, hamis"), £ 
(, igaz") logikai konstansokból, 0-I értékű változókból (mondjuk ezek 21, . . . , 7) 
és a változók 71, ..., Zn negáltjaiból a A (,és"), illetve a V (, vagy") műveleti 
jelekkel és zárójelekkel felépített kifejezés. Szokás a változókat és negáltjaikat kö- 
zös névvel illetve fiterátoknak nevezni. Egy Boole-formula változóinak (logikai) 
értékeket adhatunk. A változók ilyen kiértékelése után a kézenfekvő módon be- 
szélhetünk a formula értékéről, ami 0 vagy 1 lesz. A $ Boole-formula kielégíthető, 
ha van a változóinak olyan kiértékelése, melynél $ értéke ]. 


Példa: Az (xy V T2) A T3 formula kielégíthető (xi — 1, x2 — értéke tetszőleges, 
xrz — 0). Aza A 7) formula pedig nem kielégíthető. 


Jelölje SAT a kielégíthető Boole-formulák nyelvét (a jelölés a kielégíthetőség 
szó angol megfelelőjéből, a satisfiabilirv szóból származik). Ebben az esetben sem 
túl fontos, hogy miként kódoljuk a formulákat bináris szavakká. Egyik lehetséges 
eljárás, hogy a formula elemeinek (változók, állandók, műveleti jelek, zárójelek) 
kódjait fűzzük össze a kézenfekvő módon. A SAT nyelv benne van az NP osztály- 
ban: egy formula kielégíthetőségének tanúja egy jó kiértékelés. A bíró kiszámolja 
a formula értékét az adott kiértékelésnél. A következő eredmény szerint a SAT a 
legnehezebbek egyike az NP osztályban. 





Tétel (5. A. Cook, L. Levin, 1971): A SAT egy NP-teljes nyelv. 


Bizonyítás: (Vázlan A SAT e NP állítással már foglalkoztunk. A tétel érdemi 
részéhez azt kell igazolni, hogy tetszőleges L € NP nyelvre létezik egy L - SAT 
Karp-redukció. 

Mit jelent egy ilyen redukció? Az (xz € L?) kérdés tetszőleges a € I" inputjá- 
hoz meg kell adnunk egy é Boole-formulát, mely pontosan akkor kielégíthető, ha 
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ze L. Ennek az x 6 6 leképezésnek hatékonyan (azaz polinom időben) számít- 
hatónak kell lennie. Egyszerűbben fogalmazva: az z inputra a $ formulát meg kell 
tudnunk adni O(Izj") lépésben. 

A tanú-tétel szerint az L € NP feltétel azt jelenti, hogy van olyan L1 € P nyelv 
(a bíró nyelve) és d 5 0 konstans, hogy 


z € L pontosan akkor teljesül, 
ha van olyan y € I", melyre ly! £ Ixlf. és (x,y) € Li. 


Legyen M egyszalagos, polinomkorlátos TG, mely az Li nyelvet ismeri fel. Az 
egyszerűség kedvéért feltesszük még, hogy M szalagjelei 0,] és ü. Tegyük fel, 
hogy az íz, y) összetett bemenet az M szalagján zjéy alakban van, ahol zt egy 
elválasztó bitsorozat. Jelölje n az x input szó hosszát. és tegyük fel, hogy n!t1 4 
Izél hosszúságú inputokon M legfeljebb n" lépést tesz. Ilyen c kitevő létezik. mert 
M polinomkorlátos. Esetleg az M egy kis módosítása árán még azt is feltehetjük, 
hogy az M pontosan akkor fogadja el az inputot, ha megállás után a szalag első 
bítje E (ha elfogadó állapotba kerül, I-et ír a szalag elejére). Az M működését az 
rzéy inputon az alábbi tártérkép mutatja. Az i-edik sor M szalagját ábrázolja az 
í-edik lépés megtétele utáni helyzetben. 


we 


























il hi n" 4 
ri zi, 




















A $ Boole-formulával kapcsolatos követelményeket úgy is fogalmazhatjuk. 
hogy é hatékonyan számítható r-ből, és pontosan akkor kielégíthető, ha van olyan 
rövid y. melyre M az rxééy inputot elfogadja. A ó konstrukciójához szüksé- 
günk lesz a gép pillanatnyi helyzeteit leíró 0-1 értékű változókra: (i — 0, . . . ,n"; 
3 Sly regté szó ks JA 


Ozij 1 ha az i-edik lépés után a j-edik cella tartalma 0 
zfjl 7 1 0 különben 

ty 1 ha az i-edik lépés után a j-edik cella tartalma ! 
izlój) — 1 0 különben 
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ún 1 ha az -edik lépés után a j-edik cella tartalma ü 
91 7 Í 0 különben 
fáj £ 1 ha az i-edik lépés után a fej j-edik cellán áll 
931 — (00 különben 
üg e 1 ha az í-edik lépés után M belső állapota gs 
T6581 7 (00 különben. 


Az M működését szeretnénk leírni ezekből a változókból épített Boole- 
formulákkal. Többféle tényt kell ilyen módon megfogalmaznunk: 
1. Lekell írnunk olyan állításokat, hogy a szalag egy mezőjén minden időpontban 
éppen egy szalagjel van; a fej minden időpontban a szalag egyetlen celláján van; a 
gép minden időpontban egyetlen állapotban van. Példaként formalizáljuk az első 
típusba eső, a szalagjelekkel foglalkozó állításokat: minden i,j (0 £ i £ n", 
1c j £ n") párra 

(Ozt[i, j) v 1r[é, jl v üxli, jl)A 
AöaTE7] v TztE7)) a öözterg] vőzttj]) a aetE7T v term. 

Összesen (n" 4 Dn" ilyen formulánk lesz. Hasonlóan fogalmazhatjuk meg a fej 
helyzetével és a belső állapottal kapcsolatos állításokat, 
2. Le kell írnunk a gép átmeneteit is (lényegében a ő függvényt). Ezt is példával 
mutatjuk be. Tegyük fel, hogy a gs belső állapotra és az 1 szalagjelre ő(gs, 1) — 
(ax, 0, bal) (M a a; állapotból 1-es szalagjel olvasása esetén a gy állapotba megy 
át, 0-t ír a fej alatti cellába, majd a fej balra lép). Ezt a változóinkkal így fejezhetjük 
ki: tetszőleges 0 £ i € n", 1 ci 2 n" esetén 


(fali, 5) A 1z[é, 2) A fli, 2) — (eli 2.) A Ozlé 4-1, 4] A ffi 41, — 1). 


Emlékeztetőül: az u — v (ha u igaz, akkor v is igaz) kifejezés az t V v Boole- 
formula egy másik írásmódja. Összesen 0(n?") ilyen formulánk lesz, mert a ő 
táblázat mérete független n-től. 

Az előbbi formulák leírják, hogy mi és hogyan változik. Azt is meg kell mon- 
danunk, hogy más változás nincs; a szalag azon cellái. amelyek felett nincs a fej, 
megtartják régi értéküket. 


7.1) — (Ozli, 2] e Oz[i -- 1,1]) 


Ugyanilyen formulák kellenek még az I és az ü jelekkei is. Ezek együttes száma 
szintén O(n2c). 
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3. A gép kezdő helyzetének (a go belső állapotban van, a fej az első cellára mutat) 
a leírása így néz ki: 
a[0,0] A 7I0, 13 

Legyen $m az m-edik lépés utáni helyzetet leíró formulák A-e (konjunkciója). 
Ab z do A... A $ne formula azt fejezi ki, hogy a tártérkép a 0. sor alatt úgy van 
kitöltve, ahogy azt M tenné. 

Jelölje 4(z) azt a formulát, melyet úgy kapunk 1$-ből, hogy A-el hozzákap- 
csoljuk azt az állítást, mely szerint az input 74 előtti része éppen az z szóval egye- 
zik meg (pl. 4(z) — 4 A Oz[0, 1) A 12[0, 2] A O2[0, 3] . . . , haz — 010. . .). Végül 
legyen 

$ — Lafn", T]JA p(e). 


Az flisjl, ali. s), Ozli, 3), 1elé, j],üx[i, j) változók valamely kiértékelésénél a $ 
formula értéke pontosan akkor lesz igaz, ha van M-nek olyan legfeljebb n" lépéses 
elfogadó számítása, melynél az input első fele z. A $ kiértékelésekor a tényleges 
szabadsági fok az y súgásnak megfelelő Ox(0, j), 1z(0, j), ür(0, j) változók érték- 
adásában van, A $ tehát pontosan akkor lesz kielégíthető formula, ha az inputnak 
a gt utáni része kitölthető úgy, hogy ebből a helyzetből indulva M elfogadó álla- 
potban álljon meg a munkája végén. Ez pedig éppen azt jelenti, hogy x € L. A 
vázolt módon a $ formula g és M ismeretében polinom időben megadható, tehát 
a kapott x A $ függvény tényleg egy L - SAT Karp-redukció. D 


A bizonyítás szerint a gép működését le lehet írni egyetlen Boole-formulával. 
Eme figyelemre méltó tény a logika kifejező erejét mutatja. A logikának ez a na- 
gyon erős leíró képessége fontos szerepet játszik a számítástudomány más terü- 
letein is; említhetjük itt a töogikai programozás nyelveinek hajlékonyságát, vagy a 
modern adatbázisok lekérdező felületeinek (mint pl, az SOL) gazdag és emberi 
léptékű kifejező erejét. 





8.7. További NP-teljes feladatok 


Ebben a részben további NP-teljes feladatokkal ismerkedünk meg. Felvetődik a 
kérdés, hogy miért foglalkozunk ezekkel ilyen behatóan, ha ezekre — széles kör- 
ben elfogadott sejtés szerint — nem adható hatékony algoritmus. Azért szentelünk 
ennyi figyelmet az NP-teljes feladatoknak, mert szinte mindenütt ott vannak. Ta- 
pasztalati tény, hogy a fontos, érdekes algoritmikus problémák között igen gyakran 
találunk ilyeneket (a szakirodalomban dokumentált NP-teljes feladatok száma jó- 
val ezer felett van). Az is gyakori jelenség, hogy egy kezelhető (mondjuk P-beli) 
probléma paramétereinek látszatra ártatlan változtatásával már NP-teljes felada- 
tot kapunk. Ha egy problémáról tudjuk, hogy NP-teljes, akkor azt is tudjuk, hogy 
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nem érdemes sokat fáradozni hatékony algoritmus keresésén. Néhány lehetséges 
kerülőúttal a következő fejezetben foglalkozunk. Az NP-teljességgel kapcsolatos 
ismeretek tehát segítenek eligazodni abban, hogy egy adott algoritmikus feladatra 
milyen (mennyire gyors, milyen pontos) megoldás keresése lehet reális célkitűzés. 
Az alábbi egyszerű állítás segítségével igazolhatjuk nyelvek NP-teljességét. 





Állítás: Ha az La nyelv NP-teljes, L2 € NP és La - Lo, akkor La is NP-teljes. 


Bizonyítás: Mivel L2 € NP, elég megmutatni, hogy L" - L2 minden NP-beli 
L/ nyelv esetén. A feltételek szerint L" — La és L4 - L2. Legyenek f és ga 
redukciókat megvalósító FP-beli függvények. Ekkor g o f (az a leképezés, mely 
az z szóhoz a g(f(2)) szót rendeli) egy L" - La Karp-redukció. Tetjesül tehát a 
definíció második követelménye is, így La tényleg NP-teljes. O 


A Cook-Levin-tétel után szinte minden NP-teljességet bizonyító gondolatme- 
net az előző állításból adódó utat használja. Nem kell már minden NP-beli nyelvet 
az La-re redukálni; elég ezt megtenni egyetlen NP-teljes L: nyelvvel. 

Ha az La nyelvről csak azt tudjuk, hogy van olyan NP-teljes La nyelv, melyre 
Ia A Le, akkor L2-t NP-nehéz nyelvnek nevezzük. Az előző állítás szerint Lo 
pontosan akkor NP-teljes, ha NP-beli és ugyanakkor NP-nehéz is. 


8.7.1. . Konjunktív normálformájú formulák kielégíthetősége és a 
3-SAT 


A $ Boole-formula konjunktív normálformájú. ha $ — Ér A ::" A Ék alakú, ahol 
a d; formulákban literálok szerepelnek kizárólag V jelekkel összekapcsolva. A $; 
formulákat ekkor a $ tagjainak nevezzük. Az ítéletkalkulus azonosságai (disztri- 
butivitás, De Morgan szabályok) segítségével könnyen látható, hogy minden for- 
mulához van egy vele ekvivalens (minden kiértékelésre ugyanazt az értéket adó) 
konjunktív normálformájú formula. 





Feladat: Mutassuk meg, hogy egy Boole-formula konjunktív normálformájú ekvi- 
valensének kiszámítására nincs polinom idejű algoritmus. (Előfordulhat, hogy az 
eredmény mérete nem polinomiális az input méretéhez képest.) 


Ha a ó; formulákban legfeljebb k líterál szerepel. akkor $-t k-konjunktív nor- 
málformájú formulának (szokásos rövidítéssel k-CNF-nek) nevezzük. 


Példa: Az alábbi formula egy 4-CNF: 


(E VagVrs Vag) Alma VET VES) A (z9 V Z10 V 713). 
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Jelölje k-SAT a kielégíthető k-CNF-ekből álló nyelvet. Egy k-CNF kielégít- 
hetőségének a tanúja lehet egy kielégítő kiértékelés. A tanú a formula értékének 
kiszámításával hatékonyan ellenőrizhető, tehát k-SAT € NP. Ez a nyelv könnyű, 
hak — 2: 


Feladat: Mutassuk meg, hogy 2-SAT € P. (Legyen $ egy 2-CNF. Jelölje ég, 
illetve $1 azokat a 2-CNF-eket amelyeket $-ből az xi — 0), illetve xy — 1 helyet- 
tesítések után kaptunk. A é;-ről gyorsan kideríthetjük a következők valamelyikét: 
1. é; kielégíthető, 

2. $; nem kielégíthető, 

3. $; kielégíthetősége ekvivalens egy é; 2-CNF kielégíthetőségével, aminek tagjai 
$-nek ís tagjai, és amelyben az zi változó nem szerepel.) 


Ha eggyel több literált engedünk meg a zárójelekben, akkor a helyzet alaposan 
megváltozik; a könnyű problémából nehéz lesz. 


Tétel: A 3-SAT nyelv NP-teljes. 





Bizonyítás: Az előzőek alapján elég megmutatni, hogy SAT — 3-SAT. Olyan 
polinom időben számítható megfeleltetést kell adnunk, mely egy é formulához 
(a SAT bemenetéhez) egy d 3-CNF-et rendel úgy, hogy é akkor és csak akkor 
kielégíthető, ha a kielégíthető. 

Legyenek 21, r2, . . . , tn A ó formulában szereplő változók, és írjuk fel a $ 
egy kifejezésfáját, majd számozzuk meg a fa csúcsait, minden csúcshoz egyedi 
sorszámot rendelve. A fa csúcsai a ó részformuláinak felelnek meg. A csúcs feletti 
leveleknek értéket adva a részformula kiszámítható; e megfeleltetés révén beszél- 
hetünk a csúcshoz tartozó értékről. Az i sorszámú csúcshoz a ($ változóítól és 
egymástól is különböző) z; Boole-változót rendeljük. 





Ezen felül az íi sorszámú csúcshoz rendelünk még egy é; Boole-formulát. Egy- 
szerű szavakba foglalva: a é; formula azt fogja kifejezni, hogy a z; értéke legyen 
72 
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az i-edik csúcshoz tartozó érték az xzj változók egy adott kiértékelésekor. Innen a 
$; formulák definíciója már kézenfekvő (az u 6 v kifejezés az (TV. o) A (u vo), 
azaz a logikai ekvivalencia rövidítése): 

Ha az í-edik csúcs levél, amelynek tartalma az u literál (zj, vagy Ti), akkor 
legyen é; : z; € u. 

Ha az i-edik csúcsban A van, és a fiai a k-adik és (-edik csúcsok, akkor legyen 
$i: 2 8 (zk A 20). 

Ha az í-edik csúcsban V van, és a fiai a k-adik és 1-edik csúcsok, akkor legyen 
di: 28 (24 V.20) 


Jelölje m a kifejezésfa gyökerének a sorszámát. Következő lépésként vegyünk 
mindegyik $;-hez egy ekvivalens konjunktív normálformájú formulát, Legyen ez 
1;. A $i formulában legfeljebb 3 változó van (bizonyos x-ek és bizonyos 2-k), 
ezért tb; egy 3-CNF. Legyen 4 — (Aw;) A zm. A 4 egy 3-CNF, lévén ilyenek 
konjunkciója. A 1 értéke a változóinak a kiértékelésekor pontosan akkor lesz 1 
(vagyis ságaz"), ha ennél a kiértékelésnél mindegyik 14; ÉS zm is igaz. Mindez 
egyenértékű azzal, hogy minden i-re a zz változó értéke megegyezik a $ kifeje- 
zésfa szerinti számításánál az í-edik csúcshoz tartozó részeredménnyel, ÉS (a 2m 
tag jelenléte miatt) a b értéke is 1. Úgy is fogalmazhatunk, hogy az a; értékek 
tetszőleges megválasztása után a ib; formulák egyértelműen igazzá tehetők: a zi 
változónak az i-edik csúcsnál fellépő értéket kell adni. A 1 ezek szerint ponto- 
san akkor kielégíthető, ha $ is ilyen tulajdonságú. Más szóval $ € SAT pontosan 
akkor teljesül, ha 4 € 3-SAT. Végül megjegyezzük, hogy a ap előállítására adott 
recept RAM-on lineáris időben implementálható. A $ — 4 megfeleltetés tényleg 
egy Karp-redukció. 0 


8.7.2. 3 színnel színezhető gráfok 


Korábban már láttuk, hogy a 3-SZÍN, a három színnel színezhető gráfok nyelve az 
NP osztályban van. A következő állítás szerint ez a nyelv is az NP legnehezebbjei 
közül való. 


Tétel: A 3-SZÍN nyelv NP-teljes. 


Bizonyítás: Elegendő megadni egy 3-SAT X 3-SZÍN Karp-redukciót. Pontosab- 
ban fogalmazva, egy tetszőleges 4 3-CNF-hez építenünk kell egy G gráfot úgy. 
hogy v € 3-SAT pont akkor igaz, ha G € 3-SZÍN. A konstrukciónak hatékony- 
nak, polinom időben elvégezhetőnek kell lennie. 

Tegyük fel, hogy a 4 formulában m változó és z nyitózárójel van: 
ab —(01) A... A (02). Feltehető, hogy minden egyes 4; pontosan 3 tagú (pél- 
dául x1 V 22 helyett vehetjük az zi V 2 V 2 formulát). A G gráfnak 2m-- 5242 
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csúcsa lesz. Van két különálló csúcs: u és v. A g-beli xr; változónak és negáltjának 
is megfelel egy-egy csúcs; ezek jele z;, illetve £;. Végül a 4; részformulának 5 
csúcs fog megfelelni; ezek bő , . . . , bő. 


VIG) z Za (za Ti) LV Ujj VŐ) AV (v, ú). 


A G élei a következők: 





(vu), 

(ív, z), 1... ,m, 

(v. zh 1,...,m, 

(z, 74), 1.....m, 
E(G) — (u), 1,...,2, 

(u, 49), j-1,...,z, 


(wit), j7-1,...,z, k modulo 5 fut, 
(péz), aholajj k-adik tagja zi 3—1...,z,k-1,2,3, 
(wi,7), ahol; k-adik tagjai, j71,...,2, kz1,23. 


A G gráfban ötszögek felelnek meg a ib; formuláknak. Ezek , alsó" pontjai u-val 
vannak összekötve, a felső pontjai pedig egy-egy a 1$,-ben előforduló literállal. A 
következő ábra azt az esetet szemlélteti, amikor 41 — 21 V 72 V 23. 


EGE HV Tr eat fm 





. A G mérete lineáris 4 méretében, és az is látható, hogy G könnyen (polinom 
időben) felépíthető a ismeretében. Igazolnunk kell még, hogy 


G € 3-SZÍN pontosan akkor, ha 4 € 3-SAT. 


280 8. AZ NP NYELVOSZTÁLY 


Vegyük először G egy 3-színezését. Nevezzük v színét pirosnak, t-ét sárgának, 
a harmadik szín legyen a zöld. Vegyük észre, hogy egy literál színe csak zöld vagy 
sárga lehet a v-vel összekötő él miatt. A $ formula y literáljának adjuk az igaz 
értéket, ha a G-ben az y csúcs zöld; ha y sárga színű, akkor az értéke legyen hamis. 
Ez megfelel az x; változók egy kiértékelésének. Az (x;, T;) él megléte miatt az x; 
és Tf; csúcsok közül az egyik sárga, a másik zöld. Megmutatjuk, hogy így a 4 egy 
kielégítő kiértékelése adódik. Ez egyenértékű azzal az állítással, hogy mindegyik 
4i-ben van zöld literál. Ez pedig igaz, hiszen ellenkező esetben a 1;-hez tartozó 
ötszög csúcsaira csak két szín volna megengedett (piros és zöld); az ötszög viszont 
nem színezhető két színnel. 

A fordított irányú állításhoz vegyük 1) egy kielégítő kiértékelését. Feleltessük 
meg, mint előbb, a literálok igaz értékének a zöld színt, a hamis értéknek pedig a 
sárga színt. Színezzük v-t pirosra, u-t pedig sárgára. Az eddig kapott részleges szí- 
nezéssel nincs baj, már csak a 4; formulákhoz tartozó ötszögeket kell kiszínezni. 
Egy ilyen ötszög minden csúcsára tiltott a zöld és a sárga színek egyike. Az alsó 
két pontra a sárga, a felső csúcsokra viszont nem mindenütt a sárga, hiszen 4;-ben 
van zöld literál. Az alábbi egyszerű feladat szerint ilyenkor az ötszög kiszínezhető, 
ua) 





Feladat: Az ötpontú kör kiszínezhető 3 színnel úgy is, hogy minden egyes csú- 
csára kijelölünk egy tiltott színt, de nem minden csúcsra ugyanazt a színt. 


Feladat: Adjunk lineáris (uniform) költségű algoritmust egy gráf két színnel való 
színezhetőségének eldöntésére. 


8.7.3. . Maximális méretű független pontrendszer gráfokban 


A G gráf csúcsainak 5 részhalmaza független halmaz, ha 5-beli pontok között nem 
fut G-ben él. A G gráf fontos jellemzője a legnagyobb méretű független ponthal- 
mazának elemszáma. Ennek a kiszámítása nehéz algoritmikus probléma, amint azt 
a MAXFTLEN nyelv mutatja. 


5 Észe 
MAXEFTLEN — (tc, gy [egy éről esz zés ) 


G-nek van k elemű független csúcshalmaza 





Példa: Az ábrán látható G gráf esetén (G, 1), (G,2) e MAXFTLEN, (G,3) £ 


MAXFTLEN. 
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Tétel: A MAXFTLEN nyelv NP-teljes. 


Bizonyítás: Nyilvánvaló, hogy MAXFTLEN € NP: a (G,k) E MAXFTLEN 
ténynek tanúja lehet egy k-elemű 5 GC V(G) független csúcshalmaz. Elegendő 
ezután megadni egy 3-SZÍN - MAXFTLEN Karp-redukciót. Legyen a G gráf a 
3-SZÍN egy inputja. Olyan (G1,k) párt kell hatékonyan megadni (Gi egy gráf, k 
egy pozítív egész), melyre érvényes a következő: 


G € 3-SZÍN pontosan akkor, ha (G1, k) E MAXFTLEN, (x) 


A G1 gráfot a következőképpen kapjuk a G-ből: veszünk három példányt G- 
ből, ezek legyenek GW, G2) GŐ), és kössük össze élekkel a G azonos csúcsa- 
inak megfelelő pontokat, Így av € V(G) csúcs három példánya vld e G(Ü 
(i — 1,2,3) egy háromszöget feszít G1-ben. 








A G) csúcsainak és éleinek számára a következőket kapjuk: 


IGY 7 SIV (GYI és JE(G1)I — SIV (GYI -- SIE(GÓI. 


Legyen k — ÍV(GII. A G ismeretében a (G1,k) pár hatékonyan megadható. A 
tétel bizonyításához ezután elegendő a (x) állítást igazolni, 

Tekintsük először a G egy 3 színnel való színezését, ahol a színek 1,2,3. Áll 
jona H C V(G1) halmaz azokból a v() pontokból, melyekre v € V(G) színe 
i. Másképp fogalmazva: egy i színű G-beli pontnak az i-edik szinten levő példá. 
nyát vesszük H-ba, A színezés definíciójából azonnal kapjuk, hogy a H halmaz 
független, és !H] — k. Van tehát G1-ben k független pontból álló halmaz. 

Fordítva, legyen H egy k elemű független halmaz G1-ben. Nyilvánvaló, hogy 
ekkor H minden oszlopból e, 2 00) hármasból) pontosan egy csúcsot tartal: 
maz, Legyen a v € V(G) csúcs színe i, ha ví?) e H. Ez jó színezése lesz G-nek 
hiszen ha az e és v csúcsok azonos színűek, akkor ul?) , v(? € H valamely i-re 
Ekkor pedig H függetlensége miatt (u, v) € E(G). a 

A MAXFTLEN nyelvre vonatkozó tételből könnyen adódik két rokon gráfel- 
méleti probléma NP-teljessége. Legyen 


MAXKLIKK — ((G, k)l G-ben van k pontú teljes részgráf). 
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Következmény: A MAXKLIKK nyelv NP-reljes. 


Bizonyítás: Nyilvánvaló, hogy MAXKLIKK € NP. Az X GC V(G) csúcshalmaz 
pontosan akkor független a G gráfban, ha X klikk (teljes részgráfot feszít) a G gráf 
G komplementer gráfjában. (A G pontjai ugyanazok, mint G pontjai, és (u, v) él 
G-ben pontosan akkor, ha (u,v) nem él G-ben.) Ebből azonnal adódik, hogy a 
(G,k) B (G, k) megfeleltetés egy MAXFTLEN -— MAXKLIKK Karp-redukció. 
a 


A G gráf csúcsainak egy X részhalmaza éllefogó halmaz, ha a G bármely 
élének van X-beli végpontja. Legyen 


Éllefogás — ((G,k)l G-ben van k pontú éllefogó halmaz). 


Feladat: Mutassuk meg, hogy a H C V(G) halmaz akkor, és csak akkor független 
halmaz G-ben, ha V(G) 4 H egy éllefogó halmaz. 


Következmény: Az Éllefogás nyelv NP-teljes. 


Bizonyítás: Nyilvánvaló, hogy Éllefogás E NP. Másfelől az előző feladat- 
ból azonnal következik, hogy a (G,k) A (G,IV(G)I — k) megfeleltetés egy 
MAXFTLEN - Éllefogás Karp-redukció. 


Megjegyezzük. hogy a MAXFTLEN, 3-SZÍN és Éllefogás nyelvek akkor is 
NP-teljesek maradnak, ha még azt is kikötjük, hogy G egy síkba rajzolható gráf. 


Feladat: Mutassuk meg. hogy síkba rajzolható gráfokra a MAXKLIKK feladat 
megoldható polinom időben. 


Feladat: Mutassuk meg, hogy páros gráfokra az Éllefogás feladat polinom időben 
megoldható. (König Dénes minimax tétele.) 


8.7.4. . A 3 dimenziós házasítás és az X30 feladat 


A következő algoritmikus probléma a korábban megismert párosítási feladat ál- 
talánosításának tekinthető. Legyenek U , U2, Us azonos méretű véges halmazok, 
mondjuk legyen [U;] — t. Tegyük fel, hogy adott még U1 x U2 x Uz valamely 
§ részhalmaza. Egy ilyen részhalmaz (ui, u2, us) alakú hármasokból áll, ahol 
uz € U;. Szeretnénk eldönteni, hogy kiválasztható-e 5-ből egy 3 dimenziós há- 
zasítás, Ezen az 5 egy olyan t-elemű S" részhalmazát értjük, mely minden U;- 
beli pontot lefed. Utóbbi követelmény pontosabban így fogalmazható: tetszőleges 
vi € U; elemhez van olyan $ E 5", melynek é-edik komponense v;. AZ IST —t 
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feltétel miatt egy 3 dimenziós házasítás az U4 UJ U2 U U3 elemeit pontosan egysze- 
resen fedi le. 

Jelölje 3-DH az olyan UL, U2, Us; § C Ui x U2 x U3 rendszereket, melyeknél 
§-ből kiválasztható egy 3 dimenziós házasítás. 


Tétel: A 3-DH feladat NP-tetjes. 


Bizonyítás: Nyilvánvaló, hogy 3-DH € NP. Egy alkalmas §" halmaz játszhatja a 
tanú szerepét. A bizonyítás érdemi része egy 3-SAT - 3-DH redukció lesz. Legyen 
$ € 3-CNF. Tegyük fel, hogy $-ben m változó (1, . . . , tm) és z nyitózárójel van; 
67 (d) A... A (d). 

Az U1 halmazt úgy képezzük, hogy minden egyes literálnak (z; vagy €;) meg- 
feleltetünk z különböző elemet, így t — 2mz és 


U-fagilisismiéjázk 
Az a; változó helyettesítéseinek a következő hármasokat feleltetjük meg: 
ES 7 (md aj lis j ez 


Epamis 2 (at ed) lis j ez) 


ahol a j szerinti indexelést ciklikusan végezzük, azaz at! — al, Könnyen látható, 


hogyaz faj j - 1...) V(tÍ lg — 1... ,z) halmaz EJ997 ú Ehemis beli 
hármasokkal csak úgy fedhető le egyrétűen egy rögzített i-re, hogy vagy az Ej" , 
vagy az Epomis rendszert vesszük §7-be. Előbbi esetben az U; halmazból a z darab 
aj z ígaz értéknek megfelelő 2), . . . , z7 elem, utóbbi esetben pedig a z darab 
xy sz hamis értéknek megfelelő €;5, . . . , f;7 elem marad lefedetlenül. 





igaz hamis 
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A d; részformulának feleltessük meg a következő hármasokat: 

F; — ((xj cs. dj) ] zi literálja $5-nek) U ((77 , cz, d) ] ő: literálja ó5-nek). 
Az F; halmaznak legfeljebb 3 eleme van, mert a $; legfeljebb 3 literált tartalmaz. 


Például a $; — xi V Ta V x3 részformulának megfelelő hármasok így szemléltet- 
hetők: 


KZES 


ES zés 


Rögzített j-re a cj, valamint a dj elemek egyrétű lefedése az F; halmaz egyet- 
len elemének a kijelölését jelenti. Az eddigiek alapján az alábbi H halmaz 







szet 
li 


pontosan akkor fedhető le egyrétűen (2, (Ej u Ehamis jú Uj Fjrbeli hár- 
masokkal, ha a $1, . . . , óz formulák együttesen kielégíthetők. A cs-t fedő hármas 
felel meg egy igaz értékű literálnak $,-ből, az af elemek pedig biztosítják, hogy 
ez a kijelölés megfelel a változók egy kiértékelésének (ha valahol az u literált vá- 
lasztjuk igaznak, akkor a ü líterált sehol sem választhatjuk igaznak). 

Már csak az van hátra, hogy kiegészítsük az eddigi konstrukciót a 3-DH egy 
inputjává. Az a? , valamint a c; elemeket az U2 halmaz elemeinek tekintjük, a b7 , 
valamit a d; elemeket pedig az U3 halmaz elemeinek. Ki kell egészíteni az U2 és 
U3 halmazokat t — 2mz eleművé, Az eddigi hármasok rendszerét pedig úgy kelt 
bővíteni, hogy a H halmaz fenti szerkezetű egyrétű fedései, és csak azok legyenek 
kiegészíthetők az U1 UJ U2 U U3 halmaz egyrétű lefedésévé. Ezek nyilvánvalóan 
teljesülnek, ha beveszünk U2-be, valamint U3-ba még egyenként z(m — 1) ele- 
Met: ez , . , .  é(m-1)ret, illetve fi; . . . , firm-1)-et, továbbá a hármasok rendszerét 
kiegészítjük a 


falls 1... sm, jzl,...,zhutejlj 
(B li m:jz1,...sjU[dj [d 











G — 
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halmazzal. Beláttuk tehát, hogy az eredeti $ € 3-CNF pontosan akkor kielégíthető, 
ha az 


U —(aimöli-1,....m,j—1...,2) 
U2 —(alyejek hi 71... ,m, j-1,...,zok-1,...,zlm-1)) 
Us — (bi.d;.fxli-1,....m, 371... sz,kzl...,z(lm-1)) 
S -GUUZKES U Eper 0 Uj Ej 


inputra a 3-DH feladat megoldható. A konstrukció polinom időben elvégezhető; a 
tételt igazoltuk.0 


Egy szorosan kapcsolódó érdekes probléma a Pontos fedés hármausokkat: 
adott egy U véges halmaz. és (7 háromelemű részhalmazainak egy Z - 
(X1.X2...., X4) családja. Eldöntendő, hogy az 7-ből kiválaszthatók-e páron- 
ként diszjunkt haimazok, melyek együttesen lefedik U-t. Jelölje X3C azokat az 
(U, F) párokat, melyekre az 7-ből kiválasztható U ilyen értelemben vett pontos 
fedése. 


Példa: Legyen U — (1,2,3,...,9), 


F - ((1,.2.3)(14.5b(1.6.7). (18.99) és 
F 7 ((1.2.3).(45.6).(1.6.7).(7,8.9). 


Ekkor 7-ből nem választható ki pontos fedés, hiszen az 1 benne van mindegyik 
hármasban. Tehát (U, F) € X3C. A F" viszont tartalmazza U egy pontos fedését, 
ezért (U, F") € X3C. 


Állítás: Az X3C nyelv NP-teljes. 


Bizonyítás: X3C € NP teljesül; tanú lehet egy pontos fedés. Megmutatjuk ezu- 
tán, hogy 3-DH — X3C. Legyen Ui, U2, U3; S a 3-DH egy inputja. Az elemek 
esetleges átnevezése után feltehetjük, hogy az U; halmazok páronként diszjunk- 
tak. Legyen UV — Ui U U2 U Uz, és F — ((a,b.cH (a,b,c) € S). Könnyű 
meggondolni, hogy az így kapott megfeleltetés Karp-redukció. Ennek a részleteit 
az olvasóra bízzuk. 3 


8.7.5. . Hamilton-kört tartalmazó gráfok és az Utazó ügynök probléma 


Korábban már foglalkoztunk az irányítattan, illetve irányított Hamilton-kört tartal- 
mazó gráfokkal, megállapítva, hogy a H és IH nyelvek NP-beliek. Most megmu- 
tatjuk, hogy ezek is nehéz nyelvek. 
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Tétel: Az /H nyelv NP-teljes. 


Bizonyítás: Megmutatjuk, hogy Éflefogás - IH. Legyen G — (V, E) egy irányí- 
tatlan gráf, k pedig egy pozitív egész. Feltehetjük, hogy k £ IV(G)I. A (G, k) pár 
segítségével hatékonyan (polinom időben) elkészítünk egy G" — (V", E") irányí- 
tott gráfot, melyben pontosan akkor lesz irányított Hamilton-kör, ha G élei lefog- 
hatók k csúccsal. A G minden e — (u, v) € E éléhez elkészítjük a 


G — (VE) 7 fenem eses 


1 2 2 1 1 1 2 2 2 2 
(e — el ép E €4 ey €) — ég 4 e eg es) 





irányított gráfot. 


A G! gráfot jórészt ilyen G, alakú kis részgráfokból fogjuk felépíteni. Egy G/ 
gráfba kívülről csak az el, illetve az el csúcsokba futnak élek, kifelé pedig csak 
az eg, illetve az e2 csúcsokból mennek élek, Ezekkel a megkötésekkel könnyű 
belátni. hogy a felépítendő G" gráf egy Hamilton-köre csak a következő háromféle 
módon haladhat át a Gy, , részgráfon: 

Geo el 6 ez el Gr 





(299 el 6 el a el ez — rt 
(3) eh o eza oe e 


ep Ve 
7 
] 
e el 





Ezek után a G! gráf felépítése a következő: Vegyük G minden egyes e éléhez 
a Gt gráfot. A G minden u € V csúcsának megfelelően fűzzük fel egy irányított 
útra tetszőleges sorrendben (pl. az éllista szerinti sorrendben) az 4-hoz csatlakozó 
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éleknek megfelelő G? részgráfoknak az u csúcshoz tartozó felét (fel, e2)). Ve- 
gyünk még egy k elemű K ponthalmazt, és K ös: eleméből vezessünk élet az 
előbb megadott utak kezdőpontjához, továbbá vezessünk K minden pontjába élet 
az utak végpontjaiból. Az u € V csúcshoz tartozó irányított út így szemléltethető 
(az u foka d): 





vi 02 04.-1 


(7 


! 


LEE j Me 1 
4 K 











A formális leírások kedvelői számára legyen Ef a következő élhalmaz: 


EZ — (wa el ela — elis s egen 7 eln edu 9 wlweKk 
ahol e1 , . . . , eg, az 1-hoz csatlakozó G-beli élek listája; ezután G" így adható meg: 
V:KÜÜY F-UÜZÜUR 

ecE ecE ev 


Tegyük fel most, hogy G" tartalmaz egy H irányított Hamilton-kört. A kis gráfok- 
kal kapcsolatos (1)-(3) bejárási lehetőségeket figyelembe véve állíthatjuk, hogy ha 
valamely u € V csúcs esetén H tartalmaz legalább egy élet az Ej, halmazból, 
akkor ezen él a H egy ilyen szerkezetű darabján van: 





1 3 1 2 HB 2 § 
Ejj ét égy ör éjet éle egg een e eg ga Adja b ét 


Itt wz, wj4a € K, és egy hullámos nyíl vagy egy (1) típusú 3 hosszú utat jelöl a 
et részgráfon belül vagy pedig az el, ső El élet (utóbbi esetben szükségképpen 
a H egy másik darabja tér vissza vot maradék két csúcsát meglátogatni). 
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ugv 12EU v4.-1§U Va, EV 

















b 


ez él Ela éle 


"SSEL 





A K halmaznak k eleme van, ezért a H Hamikon-kör k darab ilyen útból tevődik 
össze: 


Wii 7 u4-nek megfelelőrész GC 0 W2—G u2— rt 
a Wwk ux-nak megfelelő rész — 101. 


A H mindegyik kis G; (e € E) csúcsait bejárja. Ez azt jelenti, hogy az ut, . . . , u 
csúcsok együttesen lefogják G éleit. Van tehát G-nek k elemű éllefogó ponthal- 
maza. 

Fordítva, tegyük fel, hogy U — fui,..., ur) egy éllefogó pontrendszer G- 
ben. Ekkor a következő utak összefűzve egy Hamilton-kört adnak a G" gráfban: 


b sZ 1 2 
dézsa Egdkai " tlsedlai (teát FT ellés. öugdtiss 


1 2 
fiÁNNKESES a CE ARSO KÉS 666 öamzálr Ea Kggábttake ) 


ahol wry — w; a hullámos nyilak G£-beli utakat jelölnek, mégpedig ha e-nek 
a másik végpontja nincs U-ban, akkor a 3 hosszú utat, ha pedig benne van, akkor 
az 1 hosszút. Utóbbi esetben az e másik végpontjának megfelelő részben található 
meg az út párja. 

Beláttuk tehát, hogy G-ben pontosan akkor van k elemű éllefogó pontrend- 
szer, ha G-ben van irányított Hamilton-kör. A G" gráf konstrukciója hatékonyan 
elvégezhető. Ezzel a bizonyítást befejeztük. 0 


A DAG-ok algoritmusainak tárgyalásakor (6.4.2. rész) foglalkoztunk a két pont 
közötti leghosszabb egyszerű utak meghatáro: ak a feladatával. Kiderült, hogy 
ez villámgyorsan, vagyis lineáris uniform költséggel megoldható, amikor a be- 
meneti G gráf egy DAG. Az előző tétel masszív érvet szolgáltat amellett, hogy 
a feladat nehézzé válik, ha a G tetszőleges irányított gráfot jelenthet. Ha volna 
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ugyanis egy gyors (mondjuk polinom idejű) módszerünk, amely megmondaná a G 
gráf u, v pontjaira a leghosszabb egyszerű u "u v irányított utak Hu, v) hosszát, 
akkor az IH nyelvet is gyorsan el tudnánk dönteni. 


Feladat: Igazoljuk az előző mondatban foglalt állítást. (Legyen a G — (V, E) irá- 
nyitott gráf az IÍH egy bemenete. Rendeljünk egységnyi súlyokat az éleihez, Mu- 
tassuk meg, hogy a G egy u — v éle pontosan akkor éle egy irányított Hamilton- 
körnek, ha a G-ből az u — v törlésével kapott gráfban I(v, u) — 1V]— 1.) 


Az IH nyelv NP-teljességét tudva az irányítatlan Hamilton-köröket tartalmazó 
gráfokról szóló hasonló állítással elég egyszerűen elboldogulunk. 





Tétel: A H nyelv NP-reljes. 


Bizonyítás: Korábban már láttuk, hogy H € NP, és az első Karp-redukció, amit 
megnéztünk, egy IH - H leképezés volt. 0 


Az irányítatlan Hamilton-kör probléma nevezetes általánosítása az Utazó ügy- 
nök feladat: adott egy G irányítatlan gráf pozitív egészekkel súlyozott élekkel. A 
cél minél rövidebb összsúlyú Hamilton-kört találni G-ben, (Az ügynök szeretné 
minél kisebb költséggel sorba látogatni az adott városokat, mindegyiket csak egy- 
szer, napszálltával hazatérve.) A feladathoz kézenfekvően kapcsolódó Ut nyelv 
olyan (G,k) párokból áll, melyekben G egy súlyozott élű irányítatlan gráf, k egy 
nemnegatív egész, és G-ben van k-nál nem nagyobb súlyú Hamilton-kör. Világos, 
hogy Ut € NP, A H feladat az Ut feladat egy speciális esetének tekinthető: minden 
élsúly ! és k — [V(G)I. Az a leképezés tehát, amely a G gráfhoz a csupa egyessel 
súlyozott élű G-t és a k — JV (G)I korlátot rendeli, egy H - Ut Karp-redukciót ad 
meg. Érvényes a következő: 


Tétel: Az Ut nyelv NP-treljes. C 


8.7.6. A Hátizsák feladat és néhány más rokon probléma 


Itt olyan kérdésekről lesz szó, melyekben az eddigiekhez képest több szerep jut 
a számoknak. Az első a Hátizsák feladat: adottak az S1,....$m 2 0 súlyok, 
ezek 01, ..., öm 5 0 értékei, valamint a b megengedett maximális összsúly. Te- 
gyük fel, hogy az s;, v,, b számok egészek. A feladat az, hogy találjunk egy olyan 
"T€ (1,.., m) részhalmazt, melyre Dier si £ b, és ugyanakkor 27 jer Vi a lehető 
legnagyobb. Szemléletes képként gondoljunk arra, hogy van egy b teherbírású há- 
tizsákunk. Ebbe akarunk belerakni bizonyosakat az s; súlyú tárgyak közül úgy, 
hogy a hátizsákban levő dolgok összértéke a lehető legnagyobb legyen. Másfelől 
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a hátizsákot kímélni kell: a bepakolt tárgyak összsúlya nem lehet több b-nél. Az I 
indexhalmaz mondja meg, hogy a súlyok közül melyeket raktuk a hátizsákba. 

Polinom idejű extra munka erejéig azonos nehézségű NP-beli feladatot ka- 
Punk, ha bevezetünk még egy k 5 0 értékkorlátot és egy adott s], . . . , Sm; 
VI... . , Vm; b; k inputra azt kérdezzük, hogy van-e olyan kímélő kítöltése a háti- 
zsáknak, melynek az értéke legalább k. Az így kapott döntési feladat (nyelv) neve 
legyen Hát. 


Hát — ((51.82, . . . , Sm; V1. 02, . . . , Um; b; k)ls;, b, k 2 0 egészek, és 
van olyan I GC (1, . . . ,m) melyre 2.8 c bés pakli sel 
ie! ie 


Feladat: Mutassuk meg, hogy Hát € P-ből Hárizsák € FP következne, (A prím- 
tényezős felbontás és az F feladat viszonyát tisztázó állítás ötlete használható: 
bináris keresésset meghatározhatjuk a legnagyobb elérhető k-t.) 

Igazából úgy gondoljuk, hogy a valóságban nem teljesül a feladat feltétele, a 
Hát nyelv nem ismerhető fel polinom időben. Ezt alátámasztandó megmutatjuk, 
hogy a Hát nyelv NP-teljes. Egészen pontosan azt a speciális esetet fogjuk szem- 
ügyre venni, amikor a tárgyak súlya és értéke azonos, valamint a súlykorlát mege- 
gyezik az értékkorláttal: s; — v; (i — 1, 2, . . . , m) és b — k. Ez Részhalmazösszeg 
probléma. Mt arról az egyszerűbb algoritmikus kérdésről van szó, hogy pontosan 
tele lehet-e rakni a hátizsákot az adott tárgyakból válogatva. A megfelelő nyelv 


s;,b 5 0 egészek, ) 


BLS (sss) és van olyan I C (1,...,m) hogy Mersi- b 





Tétel: Az RH nyelv NP-reljes. 


Bizonyítás: Világos, hogy RH € NP; alkalmas JI indexhalmaz lehet a tanú. Ezután 
megadunk egy X3C - RH Karp-redukciót. Vegyük X3C tetszőleges inputját: ez 
egy U véges halmaz és egy F — (Xi, . . . , Xm) halmazrendszer, melyre X; € U 
és [XII — 3. Ebből az RH feladat egy inputját fogjuk hatékonyan elkészíteni. 
Tegyük fel, hogy U — (1, 2, . . . , t), és legyenek 





t 
HET 
E ZS gt nágetlüt 6 ső ESYST JN 
8 - bazi tés Asz eztütlk 
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Lényegében az történik, hogy az X; halmazokat elég nagy (itt konkrétan 
r) alapú számrendszerben felírt számokkal kódoljuk. Az 7 — (sss) 
együttest fogjuk az RH inputjaként értelmezni. Az z hossza O(mtlogt), mert 
log sz; — 0(1og 2) — O(tlogt), ezért z a megadott formulák szerint (t-ben) po- 
linom időben előállítható. A megfeleltetés tehát teljesíti a Karp-redukcióval szem- 
ben támasztott hatékonysági követelményt. 


Nézzük ezután a másik előírást. Legyen ! C (1, . . . , m) egy indexhaimaz. Az 
f; - (ili € Tés j € X;)I számokat az I-hez tartozó fedési szánoknak nevezzük 
(j — 1,... 2). Az f; fedési szám azt mondja meg, hogy az íi € ! indexekhez 


tartozó X; halmazok közül hány tartalmazza a j € U elemet, Ezután megmu- 
tatjuk, hogy az 1-hez tartozó ) "ez si részhalmazösszeg és az J fedési számainak 
Ír, fa, . . . , fi sorozata kölcsönösen egyértelműen meghatározzák egymást. A rész- 
halmazösszeg így írható: 


t t 
Nsz pg - ge Milielésj e Xg — 9 gyrit 
ie ieI jJEX, gét jzi 

Aj € U pontot legfeljebb 6 számú hármas tartalmazza, ezért a jobb oldalon 
6 2 r miatt r77! együtthatója kisebb, mint r. Eszerint az f; fedési számok 
éppen az I-nek megfelelő részhalmazösszeg r alapú számrendszerbeli jegyei. Az 
r alapú számrendszerbeli felírás egyértelműsége miatt a b szám tehát akkor és csak 
akkor lesz az 7-nek megfelelő részhalmazösszeg, ha az összes fedési szám egy, ami 
éppen annyit tesz, hogy az (Xili € I) halmazrendszer pontosan fedi V-t. Tehát b 
akkor és csak akkor részhalmazösszeg, ha létezik pontos fedés. 0 


A Részhalmazösszeg probléma egy érdekes speciális esete a Partíció feladat, 
ahol a b megcélzott összeg az s; számok összegének a fele: 
s; 5 0 egészek, és van olyan ) 
IC (1,....mh, hogy Ders zza si [/ 


Arról a kérdésről van szó, hogy az (1, 2, . . . , n) halmaz felbontható-e két egyenlő 
részhalmazösszeget adó részre. Nyilvánvaló, hogy Partíció € NP. 


Partíció — fs dsg) 





Feladat: Mutassuk meg, hogy a Partíció nyelv NP-teljes, megadva egy 
RH - Partíció redukciót. (Vegyük az RH egy z — (S3,... , Sm; b) inputját. Fel- 
tehető, hogy b £ s — TIZ, s. Az z-hez rendeljük a Partíció következő inputját: 
(S1,...,Sm,§41— bb 1). Itt a számok összege 25 -k 2. Az utolsó két szám 
nem lehet egy partíció ugyanazon osztályában, mert az összegük túl nagy: $-t 2.) 

A Ládapakolás feladat a következő: adottak az s:,..., sm súlyú tárgyak, 
0 € s; £ 1, s; racionális, és egy k 5 0 egész. Eldöntendő, hogy a tárgyakat bele 
lehet-e pakolni legfeljebb k számú egységnyi súlykapacitású ládába. 
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Feladat: Mutassuk meg, hogy Ládapakolás feladat nyelve NP-teljes. (Adjunk meg 
egy Partíció aLádapakolás Karp-redukciót; elegendő két ládára szorítkozni, azaz 
ak — 2 eset is megteszi.) 

A Ládapakolás problémával a következő fejezetben is találkozunk. A feladat 
(közelítő) megoldására szolgáló algoritmusokat fogunk ismertetni. 


8.7.7. . Lineáris programozás 


Itt egy igen széles körben előforduló feladatról lesz szó. Alkalmazásaival talál- 
kozhatunk egyebek között a gazdasági számítások és a mérnöki tervezés területén. 
Egyszerűen fogalmazva, változók lineáris függvényét kell optimalizálni (maxima- 
lízálni, vagy minimalizálni) egy olyan tartományban, amelyet a változókra kirótt 
lineáris egyenlőtlenségek írnak le. Kezdjük egy nevezetes, gazdasági tónusú pél- 
dával: 


Példa: Termékszerkezet-feladat 
Egy üzem n-féle terméket tud termelni; ennek során m-féle erőforrást használ fel. 
Az erőforrások jelenthetnek pl. munkaórákat, anyagokat, gépidőket, stb. Legyen 
c a j-edik termék egységnyi mennyiségére eső nyereség, b; az i-edik erőforrásból 
rendelkezésre álló mennyiség, továbbá a;j az i-edik erőforrásból az a mennyiség, 
ami a j-edik termék egy egységének előállításához szükséges. Az üzem vezetésé- 
nek a célja egy olyan termékszerkezet kialakítása, ami az előbb leírt körülmények 
között maximalizálja a nyereséget. 

Jelölje x; a j-edik termékből előállítani kívánt mennyiséget. A feladat így fo- 
galmazható: 


n 
(6) maximalizáljuk a pa csajmennyiséget, 
71 


n 
feltéve. hogy Dare; cb iz 1,2,...,m, 
j7-1 
továbbá 720, jz1,2...,n. 


A (4) alakban felírható feladatokat — ahol a cz. b; ÉS azj tetszőleges racioná- 
lis számok -, Tineáris programozási feladatoknak nevezzük, A feladat megoldá- 
sán egy olyan racionális számokból álló (xi, 72, . . . , tn) vektort értünk, melyre 
a 7-1 cz; mennyiség (az ún. célfüggvény értéke) maximális az előírt egyenlőt- 
tlenségeket teljesítő vektorok között. 

Egy lineáris programozási feladatot tehát az n, m paraméterekkel, a cél- 
függvényt jelentő (ci, . . . ,cn) vektorral, valamint a feltételeket leíró A — [a:j)] 
(Zcigm1c£j c n) mátrixszal és (bi, . . . bm) vektorral adhatunk meg, 
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Példa: Legyenn—-2.m—3,c1 —c2—1, 


1 o 
A - 4. tg 
0.25 1 


továbbá bi — 5. ba — 12 és ba — 3. Az xy 4 x2 mennyiség maximumát keressük 
azzi $ 5, 271 -tx2 S 12,—0,2551-4-r2 £ 3.71 2 0 és 2 2 Ő egyenlőtlenségek 
által meghatározott tartományon. Ez egy sokszöglemez az (21, 12)-síkon: 












2214 x2d12 














-0.252147253 








2 





A második egyenlőtlenség ötszöröséhez adjuk hozzá a harmadik négyszeresét: 
azt kapjuk, hogy 971922 £ 72. Innen már látszik, hogy a célfüggvény optimuma 
legfeljebb 8; ezt a (4, 4)-ben el ís éri. A (4, 4) pont az egyik csúcsa a feltételeket 
teljesítő pontokból álló atakzatnak. 

Sokáig nyitott kérdés volt, hogy a lineáris programozási feladat mint algorit- 
mikus probléma milyen nehéz. A megoldására kidolgozott eljárások közül a leg- 
népszerűbb és leghasznosabb az ún. szíimplex-módszer. Ennek ismertetése itt nem 
célunk. A módszert George Dantzig javasolta a negyvenes évek végén, és mostanra 
szinte művészi tökéltyel megírt, rendkívül csiszolt implementációi születtek? . Úgy 
tűnik, a gyakorlatilag fontos feladatok széles körében igen gyors: O(m?n) arit- 
metikai művelet elegendő a ,.praktikus" feladatok megoldására. Ezzel szemben 
ismertek olyan példák, amelyeken a módszer exponenciális nagyságrendű műve- 
letet végez. A szimplex-módszer a feltételek által adott alakzat csúcsaiban keresi 





? Az egyik legnépszerűbb ezek közül a MINOS nevű rendszer. 
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az optimumot? . Megadhatók olyan 2d feltételt és d változót tartalmazó (m — 2d, 
n — d) lineáris programozási feladatok, amelyeknél a szimplex-módszer egyik 
legjobb megfigyelt viselkedésű változata 24 — 1 csúcsot vizsgál meg. 

Nagy visszhangot kiváltó áttörést jelentett L. G. Hacsijan 1979-ben javasolt 
eljárása, az ellipszoid-módszer. Az ellipszoid-módszer az első polinom idejű algo- 
ritmus a lineáris programozási feladatok megoldására. Hacsijan eredménye úgy is 
fogalmazható, hogy a probléma az EP osztályban van. Az algoritmus a gyakorlati 
feladatok körében eddig nem tudott versenyezni a szimplex-módszerrel. Jelentő- 
sége ezért elsősorban elméleti. Ilyen értelemben viszont erős eszköznek számít. 
Több érdekes kombinatorikus optimalizálási feladatra az ellipszoid-módszer se- 
gítségével sikerült polinom idejű algoritmust nyerni. 

1984-ben Narendra K. Karmarkar javasolt egy az addigiaktól merőben eltérő 
szemléletű algoritmust, a belső pont módszert, Ez — csakúgy, mint Hacsijan mód- 
szere — szintén polinomkorlátos algoritmus. A Karmarkar gondolatai nyomán szü- 
letett eljárások a gyakorlatban is versenyezni tudnak a szimplex-módszerrel. Több 
esettanulmány mutat arra, hogy nagy méretű (gyakorlati) feladatok megoldására a 
belső pont módszerek hatékonyabbak a szimplex-módszernél, Egyes szerzők sze- 
rint m 4 n 5 2500 esetén az új technikák már sokkal gyorsabbak. 

A lineáris programozás feladata tehát polinom időben megoldható, Hasonló 
mondható a megfelelő igen-nem feladatról. Ez annyiban különbözik (x)-tól, hogy 
a cj, b; és aij adatok mellett még egy racionális szám, a K korlát is része a be- 
menetnek, Az eldöntendő kérdés pedig az, hogy van-e olyan racionális számok- 
ból álló (x1, x2, . . . , Pn) vektor, melyre a (x)-beli egyenlőtlenségek teljesülnek, és 
25-ajgj 2 K. 





Egész értékű lineáris programozás 


A lineáris programozási probléma ,.diszkrét" változata az egész értékű lineá- 
ris programozási feladat. Ezen olyan, a (x) alakban felírható feladatot értünk, 
amelyben a c;, b; és ai; adatok egészek, és az optimumot az egész koordi- 
nátájú (xy, x2,...,Tn) € Z" vektorok körében keressük. A megfelelő nyelv 
(igen-nem probléma) a racionális esethez hasonlóan kapható meg. Álljon az EP 
nyelv azokból a (I; €1,...,€n: bi,...,Dmi G11, a12,. . . , amn) bemenetekből 


"Az előző síkbeli példához hasonlóan magasabb dimenzióban (n. 5 2) is beszélhetünk az egyen- 
lőtlenségek által kijelölt tartomány csúcsairól. Ezek az olyan (21. . . , 2) pontok közül kerülnek 
ki, amelyekre az n -k m egyenlőtlenség közül n-ben egyenlőség . Megmuratható, hogy ha a 
feladatnak van egyáltalán megoldása tvéges oplimuma), akkor a csúcspontok egyike is megoldás 
lesz. 
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(K, cj, bi, aij € Z), amelyekhez van olyan (zi, 2, . . . , tn) € Z" vektor, hogy 


Igzj2 KK, Yaizj S bi, 17 1,2,...,m, észj 20, j71,2,...,n. 
j71 j7-1 


Megmutatható — ennek a részleteire nem térünk ki -, hogy az EP nyelv az NP 
osztályban van. Egy megfelelő (z1, T2, ... , 7) e (Z?)" vektor szolgálhat tanú- 
ként. Az is igaz, hogy az egész értékű optim si feladat és az EP nyelv fe 
ismerése polinomiálisan ekvivalens nehézségűek. Tehát ha létezne polinom idejű 
algoritmus EP felismerésére, akkor az optimalizálási feladat FP-ben lenne. A kö- 
vetkező állítást úgy is értelmezhetjük, hogy ez nem túlságosan valószínű. 





Tétel: Az EP nyelv NP-teljes. 


Bizonyítás: Megmutatjuk, hogy RH - EP, ahol RH a Részhalmazösszeg feladat 
nyelve. Az RH egy (S1, . . . , Sa; b) bemenetéhez rendeljük a következő egyenlőt- 
lenségeket: zj £ 1, j — 1,2,...,n, és bapégő sjxj S b. A célfüggvény legyen 
T5-18jzj, a korlát pedig K — b. Ezzel az EP egy bemenetét kaptuk; n változónk 
és n 4 1 feltételünk van. 

Az így szerkesztett bemenet pontosan akkor van EP-ben, ha létezik olyan 
(71, 12, . . ., Tn) € (Zt)" vektor, amelyre teljesülnek a feltételi egyenlőtlenségek, 
és 27-i 8jxj 2 b. Az utolsó feltétel miatt ekkor 37-i sjzj — b. Az zj számok 
nemnegatív egészek, így az értékük csak 0 vagy 1 lehet. Legyen I — (j; x; — 1). 
Az (sz; j € I) részhalmaz összege éppen b. 

Fordítva, ha az (sz; j € I) részhalmaz összege b, akkor az 





zj—0 hajglészj—1, hajeI 


feltételekkel megadott vektor teljesíti az egyenlőtlenségeket. A megfeleltetés tény- 
leg Karp-redukció. 0 


Az egész értékű lineáris programozás két szempontból fontos. Egyfelől rend- 
kívül sok érdekes optimalizálási feladat fogalmazható meg ebben a keretben. Az 
alkalmazási területeknek se szeri, se száma (pl. termékterítés, gyártásszervezés, 
VLSI-tervezés, kommunikációs és szállítási hálózatok tervezése). Ennek az erős 
modellezési képességnek a szemléltetésére ajánljuk az olvasónak, hogy fogalmaz- 
zon meg néhány további NP-teljes feladatot egész programozási kérdésként: 





Feladat: Adjunk meg (minél egyszerűbb) L - EP Karp-redukciókat, ahol £ a 
SAT, a 3-DH, a 3-SZÍN, vagy a Ládapakolás nyelvet jelenti. 
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A másik tényező, ami miatt az egész értékű programozás megkülönböztetett 
figyelmet érdemel, hogy ezzel a feladattípussal sokat foglalkoztak és foglalkoz- 
nak a kutatók. Megoldási módszerek gazdag választéka áll rendelkezésre. Ezek a 
módszerek ugyan nem polinom idejűek — ilyenek nem is remélhetők, hiszen nehéz 
feladatról van szó -, de számos esetben használhatónak bizonyultak. 


8.7.8. . Minimális késésszámú ütemezés 


Végezetül megemlítünk egyet a sokféle NP-teljes ütemezési feladat közül. A Mi- 
nimális késésszámú ütemezés feladatának bemenete a következő: elvégzendő mun- 
kák (véges) D halmaza; minden feladat egy időegységet igényel, és egyszerre csak 
egy munkával tudunk foglalkozni. Adott még ezen kívül egy — részbenrendezés 
(irreflexív, tranzitív reláció) D-n. A da — da viszony azt jelenti, hogy a di munkát 
előbb kel! elvégezni, mint d2-t. Minden egyes d € D munkához adott a pozitív 
egész A(d) határidő. Végül adott egy T 2 0 tűréshatár. A T tűréshatár azt jelenti, 
hogy legfeljebb T olyan feladat lehet, amivel nem készülünk el határidőre. 

Az eldöntendő kérdés az, hogy lehet-e a feladatokat úgy ütemezni, hogy leg- 
feljebb T kivétellel minden feladatot határidőre befejezzünk. Pontosabban fogal- 
mazva: van-e olyan d1, da, . . . d sorrendje a D elemeinek, melyre 
1. d; 2 dj eseténi c j teljesül; továbbá 
2. legfeljebb T számú i index kivételével fennált a kíd;) £ i egyenlőtlenség? 

Az 1. feltétei a c részbenrendezés által meghatározott gráf egy topologi- 
kus rendezését követeli meg. Ez önmagában könnyen teljesíthető, hiszen a gráf 
DAG. A 2. feltétel jelenlétévei viszont nehéz feladatot kapunk. Megmutatható, 
hogy az adott tűréshatárral megoldható ütemezési feladatok nyelve NP-teijes, A 
MAXKLIKK nyelv viszonylag egyszerűen redukálható erre a nyelvre. 


9. 


Néhány általános 
algoritmus-tervezési módszer 


Minden felfedezett igazságot szabályként használva fel más igazságok 
felfedezésére ... számos olyan problémát oldottam meg, amelyet azelőtt 
igen nehéznek tartottam... RENÉ DESCARTES 


Problémákat megoldani, algoritmusokat tervezni kreatív folyamat. Ezért nem is 
várhatunk biztos recepteket, amelyek segítségével mindig elboldogulunk. De nem 
is vagyunk teljesen fegyvertelenek: vannak olyan ötletek, módszerek, megköze- 
lítések, amelyek sok esetben sikeresnek bizonyultak hatékony algoritmusok ter- 
vezésében, Ezek a módszerek konkrét feladatok hatékony megoldásaiból kristá- 
lyosodtak ki, váltak szabállyá a descartes-i értelemben. Olyan általános technikák 
ezek, amelyek feladatok széles körére alkalmazhatók. Már az eddigiek során is 
találkoztunk néhány ilyen elvvel. 

Az oszd meg és uralkodj stratégia lényege. hogy a feladatot megpróbáljuk 
visszavezetni. lvágni" ugyanezen feladat sokkal kisebb példányaira úgy, hogy 
ezek megoldásaiból az eredeti probléma megoldása gyorsan összerakható legyen. 


Példák: 

1. A bináris keresés során egy kérdéssel a keresési tartomány méretét a felére csök- 
kentjük. A hatékony keresőfák alkalmazásakor is ilyesmi történik. Egy összeha- 
sonlítással visszavezetjük a feladatot egy jóval kisebb méretű hasonlóra (feleakko- 
rára, vagy még kisebbre, mint pl. a B-fáknáb). 

2. Az összefésüléses rendezésnél két feleakkora méretű részfeladatra vágjuk az 
eredetit. Ezek megoldásából gyorsan adódik — összefésüléssel — a globális megol- 
dás. 
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3. A gyorsrendezés partíciós lépésének a célja a probléma hatékony kettévágása. 


Az oszd meg és uralkodj elv különösen akkor tud eredményes lenni, ha a vágás 
eléggé egyenletes, más szóval a kapott részek nagyjából egyenlő méretűek. Jól mu- 
tatja ezt a gyorsrendezés, ami akkor bizonyul lassúnak, ha a partíciós lépésekben 
kapott vágások nem eléggé egyenletesek. Azt is érdemes meggondolni, hogy az 1. 
és 2. példák módszereinek elemzésében, az igen kedvező korlátok levezetésében 
fontos szerepet játszott a vágások egyenletessége. 

A mohó módszer néhány alkalmazásával is találkoztunk már. Az elv valami 
olyasmit mond, hogy a feladat megoldása során a következő lépés legyen a lehető 
legjobb a rendelkezésre állók közül; itt a legjobb valami egyszerű, könnyen el- 
lenőrizhető kritérium szerint értendő, Úgy is mondhatjuk, hogy mindíg valamiféle 
ahelyi", messze nem a teljes képet figyelembe vevő optimumot választunk, és re- 
méljük, hogy ezek a választások összességükben jó megoldáshoz vezetnek. Ezt az 
egyszerűségre törekvést két nem teljesen független tényező motiválja. Egyrészt a 
teljes kép általában túl bonyolult ahhoz, hogy egy pillantásra megértsük. Másfelől 
egyszerűbb szempontok alapján könnyebben, gyorsabban tudunk választani. Lát- 
tunk szép példákat olyan esetekre, amikor a mohó megközelítés megalapozott — 
ide sorolhatók Dijkstra, Kruskal és Prim módszerei. Mindhárom módszernél meg- 
figyelhető, hogy egyszerű mohó választások sorozatával érik el a kívánt megoldást. 

Természetesen ennek, és a többi tervezési szemléletnek is megvannak a kor- 
látai. A mohó módszer kritikájaként gyakran említik a következő metaforát: kép- 
zeljük el, hogy a célunk a Mount Everest megmászása. Azt a mohó megközeli- 
tést alkalmazzuk, hogy a következő lépésünket mindig abba az irányba tesszük, 
amerre legmeredekebb az emelkedés. Világos, hogy ily módon legtöbbször valami 
kis dombtetőn akadunk el. Mindez arra mutat, hogy a módszer alkalmazhatós 
az általa elérhető eredmény minőségét körültekintően meg kell vizsgálni. 

A gyorsrendezés meggyőzően példázza a véletlent használó módszerek ere- 
jét. Az algoritmus gyakorlati sikerének a kulcsa a partícionáló elem véletlen vá- 
lasztása. Az ilyen módszerekkel — kiemelkedő fontosságuk miatt — részletesebben 
foglalkozunk ebben a fejezetben. 

Eddig példaként csupa hatékonyan kezelhető problémát említetünk. A bemu- 
tatásra kerülő további technikák nehéz problémák kezelésére is alkalmasak. Mit 
várhatunk az ilyen esetekben? Szélsebes megoldásokat nem, hiszen nehéz fela- 
datokról van szó. Például a tudomány mai állása szerint kevés a remény, hogy 
NP-nehéz feladatok megoldására igazán hatékony (polinom idejű) módszereket 
találjunk. Mégis, számos gyakorlati probléma megköveteli, hogy ilyen (vagy még 
nehezebb) feladatokra is adjunk valamilyen, természetesen minél jobb megoldó 
módszert. Lehetséges és gyakran értelmes célkitűzés az, hogy a kézenfekvő, min- 
den lehetőséget végignéző (igen gyakran butának, bambának, stb. aposztrofált) 
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módszereknél jobbat találjunk. Másféle viszonyulást jelentenek a közelítő mód- 
szerek, melyek akkor jönnek szóba, ha a pontos megoldásnál kevesebbel is beér- 
jük. Az elágazás és korlátozás elnevezésű módszert kifejezetten a nehéz felada- 
tok esetén használják. A dinamikus programozás könnyű és nehéz problémákra 
egyaránt hasznos lehet. Végezetül itt tárgyaljuk a prekondícionálás módszerét. 
Ez leggyakrabban afféle munkaszervezési ötletnek tekinthető, amivel egy feladat 
egyszerre több példányának a megoldását lehet gyorsítani. 





9.1.  Elágazás és korlátozás 


A módszer angol neve branch-and-bound. Olyan esetekben szokás alkalmazni, 
amikor a megoldandó feladat természetes módon vezet egy óriási gyökeres írányí- 
tott fa teljes, vagy részleges bejáráshoz. A fát gyakran nevezik a feladat fázisteré- 
nek. A fa általában olyan hatalmas, hogy nem érdemes (olykor nem is lehetne) 
egyszerre tárolni minden csúcsát. Vannak viszont szabályaink, amelyekkel egy 
csúcs leszármazottait elő tudjuk állítani. Ezt szokásos kifejezéssel generálásnak 
nevezzük. A feladat áltatában azt követeli, hogy a fa igen sok csúcsáról rendelkez- 
zünk információval. Az elágazás és korlátozás módszere ezt az információgyűjtést 
igyekszik gazdaságosan megszervezni. 

Első példaként nézzük egy sakkállás értékelésének a problémáját. A cél annak 
a meghatározása, hogy melyik fél - világos vagy sötét - áll jobban, és mi(k) a he- 
lyes lépések). Képzeljünk el ehhez egy fát; ennek csúcsai sakkállások, megjelölve 
azzal, hogy melyik félen van a lépés sora, Egy csúcsból (állásból) él vezet a be- 
lőle egyetlen lépéssel megkapható állásokba. Több sakkozó program használja ezt 
a szemléletet, Az állás értékének megállapításához az alatta levő részfa csúcsait 
kellene értékelni. Ez azonban túl nagy, túlságosan időigényes vállalkozás lenne. 





tázistér 


fágjuk le 


Az elágazás azt jelenti, hogy vesszük (generáljuk) az éppen vizsgált csúcs fiait, 
bizonyos esetekben egy korlátos mélységig a további leszármazottait is. A gene- 
rált csúcsok vizsgálata alapján döntjük el, hogy merre menjünk tovább lefelé a 
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fában. Ebben fontos szerepet játszanak a korlátozó hewrisztikák. Ezek a feladat tu- 
lajdonságaiból eredő megfontolások, amelyekkel igyekszünk minél több csúcsot 
és egyszerre azok leszármazottait is kizárni a további keresésből. 

A sakk esetén az elágazás azt jelenti, hogy generáljuk a néhány lépésben elér- 
hető állásokat, és azokat valahogy értékeljük. Korlátozó heurisztika lehet, hogy 
nem nézzük azokat az ágakat, ahol vezért vesztünk. Természetesen a komoly 
sakkprogramok többféle, a fentinél sokkal finomabb és bonyolultabb korlátozó 
heurisztikát használnak. A korlátozó heurisztikák alkalmazásával ágakat tudunk 
levágni a fáról, és csak az esélyes, a túlélő irányokkal foglalkozunk tovább. 

A következőkben egy kevésbé bonyolult példát veszünk szemügyre: maximá- 
lis független halmaz keresését gráfokban. A probléma eldöntendő változatáról tud- 
juk, hogy NP-teljes. 

Legyen G - (V, E) egy n pontú egyszerű irányítatlan gráf. A célunk az, hogy 
találjunk egy maximális méretű H C V független halmazt. A kézenfekvő módszer 
az lenne, hogy végignézzük V összes részhalmazát, mindegyikről eldöntve, hogy 
független-e. Ez 2" részhalmaz végigbogarászását jelentené. Próbáljuk meg ennél 
ügyesebben csinálni. Az esetek végignézésében alkalmazzuk a következő, igen 
egyszerű korlátozó heurisztikát: 


Észrevétel: Ha G-ben minden pont foka legfeljebb kettő, akkor a feladat lineáris 
időben megoldható, hiszen ekkor G izolált pontok, utak és körök diszjunkt uniója. 
Minden ilyen komponensben gyorsan találhatunk maximális független halmazt: 
komponensenként minden , második" pontot bevesszük a halmazba. 


(izolált pontok) 


9049 
öeszáet 


Ezt használja az MF() algoritmus, aminek az inputja a G gráf. 


ME(G) 
1. Ha G-ben minden pont foka £ 2. akkor MF(G) az előbbi eljárás által adott 
maximális független halmaz, és a munkát befejeztük. 
2. Legyen z € G, fok(z) 2 3. 
51 :— MEGG Ve) 
52 :— íz) UJ ME(G íz és szomszédai) ). 
3. Legyen S az Si és Sz közül a nagyobb méretű, illetve akármelyik, ha 
1511 — 152]. 
4. MH(G) :— 5. 
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A módszer helyességének megértéséhez elég meggondolni, hogy egy maximá- 
lis független halmaz vagy tartalmazza r-et, és ekkor a szomszédait biztosan nem 
(ilyen halmaz kerül 52-be), vagy nem tartalmazza r-et (maximális méretű ilyen 
halmaz kerül 5; -be). 

Nézzük ezután az eljárás költségét. Legyen T(n) az MF(G)-n (] V(G) I n) 
belüli MF hívások maximális száma, beleértve MF(G)-t magát is. 


Állítás: Van olyan c állandó, hogy T(n) £ ey", tetszőleges n természetes számra, 
ahol y ay! — y? —1 — 0 egyenlet pozitív gyöke (ry A 1, 381). 


Bizonyítás: Legyen tín) :— T(n) -4- 1. Az eljárás szerkezetéből azonnal kap- 
juk, hogy Tín) £ TÍn—-1)4T(n— 4)3- 1, han 5 4. Innen adódik, hogy 

n) £tln—1) Ht(n— 4), han 5 4. Ezután elég megmutatni, hogy t(n) £ ey" 
teljesül alkalmas c-vel, mert T(n) £ t(n). Indukciót használunk. A kívánt egyen- 
lőtlenség n c 5-re alkalmas (elég nagy) c-vel elérhető. Ezután, han 2 5, akkor 
alkalmazható az indukciós feltevés: 


t(n) £ t(n-1)-4t(n-4) ee key megyet) megett — ert. 
Az utolsó előtti egyenlőségnél használtuk a y definiáló egyenletét. CI 





A hívások előtti és utáni munka 0(ni) alkalmas d-re. Ezt a költséget 
az MF(G) hívásra terheljük. Így becsülve az összes munka O(niT(n)) — 
O(ni9") — 0(1,381"). Itt figyelembe vettük, hogy y C I, 381. A kapott módszer 
tehát, bár a korlát itt is exponenciális, jóval gyorsabb, mint az összes eset végigné- 
zése. Ennél a példánál a fa csúcsainak az MF()-hívásokat tekinthetjük. Az MF(G) 
fiai a 2. lépésben megadott hívások. A G gráthoz tartozó csúcsnak nincs további 
fia, ha az I. lépésben végzünk (sikeres korlátozás), és két fia van különben. 









Az elágazás és korlátozás módszerének másik alkalmazásaként vegyük szem- 
ügyre a 3 színnel való színezés feladatát. Az eldöntési probléma itt is NP-teljes. 
Mint előbb, legyen G — (V, E) egy n pontú egyszerű irányítatlan gráf. Szeret- 
nénk megadni G egy jó 3-színezését, ha egyáltalán létezik ilyen. A kézenfekvő 
módszer a csúcsok 3" színezésének a végignézése lehetne. Korlátozó heurisztikát 
ad a következő észrevétel: ha kijelöltük az egyik színhez tartozó csúcsokat, mond- 
juk a pirosakat, akkor polinom időben ellenőrizhető, hogy ez a részleges színezés 
kiteljesíthető-e jó 3-színezéssé. Valóban, mindössze arról kell megbizonyosodni. 
hogy a piros pontok között nem fut él, továbbá, hogy a színezetlen pontok ál- 
tal feszített gráf kiszínezhető két színnel. Mindkét részfeladat legyűrhető polinom 
időben. 





Feladat: Mutassuk meg. hogy az előbbi korlátozó heurisztika alkalmazásával a 
3-színezés feladata megoldható O(2"n") időben, ahol c 5 0 állandó. 
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9.2. . Dinamikus programozás 


A dinamikus programozás módszere gyakran használatos valamilyen numerikus 
paraméterektől függő érték optimumának a meghatározására. Lényege, hogy az 
optimumot (optimális megoldást) alkalmas kisebb részfeladatok optimumából (op- 
timális megoldásából) próbáljuk előállítani. A dinamikus programozást használó 
algoritmusok vezérlési szerkezete gyakran emlékeztet egy táblázat szisztematikus 
(pl. sorról sorra haladó) kitöltésére. A táblázat kitöltését általában egy rekurzív 
összefüggés teszi lehetővé, ami alapján a bejárási sorrend szerint korábbi elemek- 
ből meghatározhatók a későbbiek. A kapott módszer költségét többnyire a kitöl- 
tendő táblázat mérete határozza meg. A rekurzív összefüggés megtalálásában sok- 
szor a segítségünkre van az optimalitás elve, amivel a Bellman-Ford- és a Floyd- 
módszernél már találkoztunk. 

A dinamikus programozásnak vannak erőteljes alkalmazásai a könnyű és ne- 
héz problémák körében egyaránt. Működését néhány példán keresztül szeretnénk 
bemutatni. 


1. Binomiális együtthatók számítása 
Tegyük fel, hogy az (7) binomiális együttható értékére vagyunk kíváncsiak. Le- 
hetséges utat jelent a jól ismert 


n n-1I 2 snőt 

e) MEg) 

azonosság használata. Ennek segítségével a kisebb n értékektől a nagyobbak felé 
haladva adódnak a binomiális együtthatók: ha az összes 679 értéket ismerjük 
(0£ j £ n- 1), akkor az (44) alakú együtthatók egy-egy összeadással megkapha- 
tók. Az elindulás lehetőségét az (§) — (7) - 1 értékek biztosítják. Tulajdonkép- 
pen a nevezetes Pascal-háromszög (egy háromszög alakú táblázat) kitöltéséről van 
szó. Az algoritmus csak összeadásokat használ, ezért gyakorlati szempontból is 
érdekes lehet olyan aritmetikai környezetben, ahol az összeadás sokkal gyorsabb, 
mint a szorzás, 

A dínamikus programozás alulról építkező, a kisebb esetektől a nagyobbak 
felé menő stratégiája gyakran hatékonyabb alternatívát kínál a rekurzív eljárások 
felülről lefelé haladó felfogásával szemben. A binomiális együtthatók számítása 
jól mutatja ezt. A (x) összefüggés alapján megírt rekurzív eljárás árnyoldala, hogy 
többször is kiszámítja ugyanazokat a (közbülső) binomiális együtthatókat. Például 
az (7) számításakor az (777) együtthatót kétszer is kiszámoljuk. A dinamikus 
programozás gondolatát követő módszer kiküszöböli ezeket az ismétlődéseket. 
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2. A Hátizsák probléma 

Adottak az s], . . . , Sm súlyok, a b súlykorlát, a vi, . . . , vm értékek és a k értékkor- 
lát. A kérdés, hogy van-e olyan / G (1, . . . , m részhalmaz, melyre teljesül, hogy 
Diarsi Sbés Ziervi 2 k. Feltesszük még, hogy a szereplő mennyiségek mind 
pozitív egészek. A feladatról láttuk, hogy NP-teljes. 

Itt most egy dinamikus programozást használó megoldást ismertetünk. Szeret- 
nénk a feladatot visszavezetni kisebb hasonló problémákra. Ilyenkor gyakran se- 
gít, ha a feladatban megadott bizonyos paramétereket változónak tekintjük, és egy 
értelmes tartományban , futni hagyjuk". (Ez az ötlet erős eszköz a programozásel- 
méletben, amikor ciklusinvariánst keresünk.) A mi esetünkben az m és a b lesznek 
ezek a paraméterek. Pontosabban fogalmazva legyen v(i, a) a maximális elérhető 
érték az s1, . . . , s súlyokkal, ui, . . . , u; értékekkel és a súlykorláttal megadott fel- 
adatra (mível a maximális értéket keressük, nincs szükség értékkorlátokra), Ekkor 
v(0,a) — v(i, 0) — 0 tetszőleges a és í természetes számokra, és célunk a vím, b) 
mennyiség meghatározása, illetve annak eldöntése, hogy fennáll-e a vlím, b) 2 k 
egyenlőtlenség. A feladat úgy is felfogható, hogy meg akarjuk határozni az m 4 1 
sorból és b -- 1 oszlopból álló (v(i, a)]) táblázat (m, b) pozíciójú elemét, 




















fal atom b a ark barrós intés x 
keresett 
érték 


A táblázat 0 indexű sorában, illetve oszlopában az értékek ismertek, Az érde- 
kesebb helyeken levő számok meghatározásában segít a következő egyszerű össze- 
függés: 





v(i,a) z maxív(i— 1, a); vs 4 v(i— 1,a — 8) )- 


Indoklásul megjegyezzük, hogy a jobb oldalon az első mennyiség az í-edik 
súlyt nem tartalmazó választások optimális értéke, a második pedig az i-edik súlyt 
tartalmazó választások optimális értéke (mindkét esetben a súlykorlát mellett). Itt 
is érvényesül az optimaliítás elve: ha a v(i, a) értéket adó kitöltésben az s; súly 
szerepel, akkor a zsákban levő többi (az 81, 52, . . . , 5-1 közül kikerülő) súlynak 
optimális kítöltést kell adnia az a — s; súlykorláttal. 
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Az összefüggés alapján a táblázat kitölthető úgy, hogy vesszük rendre az 
1,2,...,m indexű sorokat, ezeken belül pedig az a indexet növelve haladunk, 
A táblázatnak mb eleme van. A módszer logaritmikus költsége O(bL), ahol L az 
input hossza. A módszer nem polinomiális idejű, mert b mérete [logo(b - 1)]. az 
input hossza pedig 


L - )(ftoga(szk 1] 4 flogg(v; 4 11) £ Moga(k -- 11 -k fiogz(b -- 1. 


izl 


Másfelől már a táblázat mérete is legalább mb, ami L-hez képest exponenciálisan 
nagy is lehet. Ha viszont b nem túl nagy a többi input paraméterhez képest, akkor 
a módszer akár polinom idejű is lehet. Ezt most pontosabban ís megfogalmazzuk. 


Definíció: A b egész unáris ábrázolása: 09 :— 0 . . . 0 (összesen b darab 0 egymás 
után). 


Definíció: Egy feladat egy egész input paramétere apró, ha unárisan számítjuk 
bele az input hosszába. 


Ha a b paraméter apró, akkor az input méretéhez való hozzájárulása [b] és nem 
flog2(b 4- 1)1. mint a bináris megadás esetén. A b-t akkor érdemes aprónak tekin- 
teni, amikor az unáris ábrázolása az inputban nem növelné meg az input méretének 
nagyságrendjét, Ez teljesül, ha Ibl felülről becsülhető az input más összetevői mé- 
retének egy polinomjával. Például a Hátizsák feladatnál ha b £ m$, akkor b-t 
szemlélhetjük úgy, mint egy apró paramétert. Ez természetesen nem jelenti azt, 
hogy b-t unárisan kell ábrázolnunk az inputban; arról van csupán szó, hogy a költ- 
ségszámításnál az unáris hosszát vesszük figyelembe. 


Következmény: A Hátizsák probléma apró súlykorlát esetén megoldható polinom 
időben. 


Igazolásul elég annyi, hogy ekkor Z 2 b, tehát a futási idő az input hosszának 
Polinomjával becsülhető: O(L?). 


Feladat: A Hátizsák probléma apró értékkorlát esetén megoldható polinom idő- 
ben. 


3. Legrövidebb utak gráfokban 

Itt egy korábban megismert algoritmusra pillantunk. ismét, felismerve rajta a dína- 
mikus programozás gondolati jegyeit. Ez Floyd módszere az összes pontpár kö- 
zötti távolság meghatározására: adott a C adjacencia mátrixával egy súlyozott élű 
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G irányított gráf, aminek csúcshalmaza V — (1,2,...,n). Feltesszük, hogy G- 
ben nincs negatív összsúlyú irányított kör. A módszer k — I1,2,.., , n-re sorban 
meghatározza az Fi, j) értékeket, ahol az Fil, j) a legrövidebb olyan í 6 j 
utak hossza, melyeknek a közbülső ponijai az 1, 2, . . . , k csúcsok közül valók. A 
számítás alapja az 


Fuli.jl :— min( ifi. j), 74-ali.k]- Fr 1(k, 3] 


rekurzió. A kezdőértékeket a C mátrix adja: Fo(i, j) :— Oli, j]. Itt is arról van szó, 
hogy az egyre összetettebb (egyre több közbülső pontot megengedő) optimumokat 
az egyszerűbbekből származtatjuk. Az algoritmus felfogható egy térbeli táblázat 
lapról lapra haladó kitöltésének. Legyen ugyanis B(k,i,j) — F4(i, j). Tulajdon- 
képpen a B tömb értékeit határozzuk meg a B(0, i, j) (1 £ í, j £ n) laptól indulva, 
Floyd módszerének elegáns, helytakarékos vonása, hogy ez kivitelezhető egyetlen 
n-szer n-es tömb alkalmazásával (amit az algoritmus leírásakor F(i, j]-vel jelöl- 
tünk). 





Feladat: Adott az A[(1:n,1:n)] kétdimenziós Boole-tömb. Adjunk O(n?) 
uniform költségű módszert az A-beli legnagyobb csupa egyesből álló négy- 
zetek egyikének a megkeresésére. Pontosabban: határozzuk meg a legna- 
gyobb olyan 0 £ k € n egészet, melyhez vannak olyan í,j indexek, hogy az 
Ali:i-4k,j : j 4 k) résztömb minden eleme egyes. 


9.3.  Közelítő algoritmusok 


Ne ránts tőrt, ha egy pofon is megteszi. 
SKÓT KÖZMONDÁS 


Előfordul, hogy egy nehéz algoritmikus problémával kerülünk szembe, de ele- 
gendő a céljainkhoz a megoldás (tipikusan valamilyen optimum) elég jó közeli- 
tése. Bizonyos esetekben igen egyszerű és hatékony módszerekkel kaphatunk az 
optimálishoz közeli eredményt. Érdemes lehet közelítő módszert használni akkor 
is, ha a problémára van ugyan gyors módszer, de egy a céloknak megfelelő köze- 
lítést még gyorsabban ki lehet számítani. Lássunk ezután néhány példát! 





1. Sok független él kiválasztása egy gráfból 
Legyen adott éllistával az n pontú és e élű G — (V, E) irányítatlan gráf. Szeret- 
nénk minél nagyobb méretű E" C E független élhalmazt találni. (Az E" élhalmaz 
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független, ha semelyik két E"-beli élnek sincs közös végpontja.) Ez kezelhető fel- 
adat. Egy maximális méretű E" a korábban használt terminológiánk szerint maxi- 
mális párosítás, ami polinom időben található. A páros gráfok esetét részletesen 
tárgyaltuk a gráfalgoritmusokról szóló részben. Maximális párosítás (tetszőleges, 
tehát nem feltétlenül páros gráfban is) építhető ugyan polinom időben, de az ismert 
algoritmusok elég időigényesek. Előfordulhat másfelől, hogy elegendő egy nagy 
független élhalmaz, ami esetleg nem maximális. Szerencsét próbálhatunk például 
a következő mohó ötlettel: 


Kezdetben legyen E" — 0. Vegyünk egy e € E élet, tegyiik E"-be, majd töröljiik 
E-ből azokat az éleket, amelyeknek van e-vel közös végpontjuk, A megmaradó élek 
közül tegyünk egy f élet E"-be, majd töröljük az f fel közös végpontú éleket, stb, 
egészen addig, amíg E el nem fogy. 


A fenti igen egyszerű módszer nagyon gyorsan, 0(n -- e) költséggel megva- 
lósítható. A kapott E" tovább már nem bővíthető független élhalmaz. Ha egy ilyen 
halmaz is megteszi, akkor felesleges az időigényesebb módszerekhez fordulni. 


Feladat: Legyen a G-beli maximális független élhalmazok elemszáma k. Mutas- 
suk meg, hogy a fenti algoritmus által kiválasztott E" élhalmaz mérete legalább 
k/2. 


2. Ládapakolás 

A következőkben a Ládapakolás feladat (angol nevén: Bin packing) néhány 
egyszerű és nevezetes közelítő megoldását mutatjuk be. Inputként adottak az 
51... 8m (racionális) súlyok, 0 € s; £ 1. A cél a súlyok elhelyezése minél 
kevesebb I súlykapacitású ládába. Tudjuk, hogy a probléma döntési feladatként 
megfogalmazva NP-teljes. 


Igen egyszerű és természetes közelítő algoritmus az FF-módszer (first fit, ma- 
gyarul első alkalmas). Vegyünk először üres ládákat, és számozzuk meg őket az 
1,2, . . . , k egészekkel. Ennyi előkészület után ismertethetjük a módszer általános 
lé : tegyük fel, hogy az si, . . . , $s-1 súlyokat már elhelyeztük. Ekkor s; ke- 
rüljön az első (legkisebb sorszámú) olyan ládába, amelybe még befér. Az ábra az 
FF-algoritmus működését illusztrálja. 
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Jelölje a Ládapakolás probléma egy / inputjára OPT(I) az optimális (mini- 
málisan elegendő), FF(I) pedig az FF-módszer által eredményezett ládaszámot. 

Világos, hogy Fa si S OPT(I), továbbá FF(I) c (22774 si), hiszen 
az FF elhelyezésnél legfeljebb egy olyan használt láda lehet, amely nincs félig 
kitöltve, A két egyenlőtlenséget összefűzhetjük, figyelembe véve, hogy tetszőleges 
valós x-re f2r1 c 2[7]. 

































































Következmény: A probléme tetszőleges I inputjára teljesül, hogy FF(I) S 
20PT(I). 


Valójában ennél sokkal több mondható (nem bizonyítjuk, nehéz). 


Tétel (D. S. Johnson és munkatársai, 1976): A probléma tetszőleges I inputjára 
teljesül, hogy FF(I) £ FSOPTU )1. Továbbá vannak tetszőlegesen nagy méretű 
T inputok, melyekre FF(I) 2 19(OPT(I) -1) 


Az FF tehát igen egyszerű és gyors módszer, amely eléri az optimum 17/10- 
ét. Egy kis javítással még jobb eredményt kaphatunk. Az FFD- (first fit decrea- 
sing, magyarul első alkalmas csökkenő) módszer receptje a következő: először ren- 
dezzük a súlyokat nem növő sorrendbe, utána alkalmazzuk az FF-módszert. Más- 
képpen fogalmazva: az FF alkalmazásánál feltesszük, hogy 84 2 $2 2... 2 $m. 
Az előző példa súlyai így eggyel kevesebb ládába bepakolhatók. 
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Általában érvényes a következő (nem bizonyítjuk, nagyon nehéz). It FFD(T) 
jelöli az I inputon az FFD-módszer által adott ládaszámot. 


Tétel (D. S. Johnson, 1973): Tetszőleges T inputra teljesül, hogy FFD(I) £ 
HOPT(I ) rk 4, és tetszőlegesen nagy méretű I inputok vannak, melyekre 
FFDUW) 2 $OPT(I). 


Az FFD-módszerrel elérhetjük tehát az optimális érték mintegy 11/9-ét. Az 
algoritmus rendkívül egyszerű, ugyanakkor jó közelítést ad. Megemlítjük még, 
hogy az FF D-nél valamivel jobb eredményt adó módszerek is vannak, ezek azon- 
ban egyszersmind jóval bonyolultabbak is. 


3. Euklideszi utazó ügynök 

Ez a probléma az Utazó ügynök feladat egy változata, Az n pontú Kn teljes 
gráf élein adott a nemnegatív értékű d súlyfüggvény. Erre teljesül a háromszög- 
egyenlőtlenség: tetszőleges különböző u, v, w csúcsokra érvényes a 


díu,w) £ d(u,v) 4 dív, w) 


egyenlőtlenség (az euklideszi feltétel). A cél egy minimális összsúlyú Hamilton- 
kör keresése, 


Feladat: Mutassuk meg, hogy az Euklideszi utazó ügynök eldöntési változata NP- 
teljes, (A H nyelvet, a Hamilton-kört tartalmazó gráfok nyelvét redukáljuk erre 
a nyelvre. Legyen a G gráf a H egy inputja. A G éleinek a súlya legyen I, a G 
komplementerébe tartozó éleké pedig legyen 2.) 


Jó közelítő megoldást kaphatunk a következők szerint. Vegyük először a sú- 
lyozott K, gráf egy T minimális összsúlyú feszítőfáját. Jelölje s a T fa költségét 
(súlyát). Egy ilyen T fa hatékonyan kapható Kruskal vagy Prim módszerével. He- 
lyettesítsük a T éleit egy-egy pár ellentétesen irányított éllel: az (u, v) irányítatlan 
él helyett az u 0 vésaw — u éleket vesszük. Az így kapott irányított gráf legyen 
T". A T"-ben minden pontnak a be-foka megegyezik a ki-fokával, tehát van zárt 
Euler-bejárása. Egy ilyen bejárás gyorsan számítható. Írjuk le ezután a K, csúcsait 
egy olyan sorrendben, ahogy az Euler-séta során végiglátogatjuk őket: 


(a) u 7 UL, 2 . . . , V2n—2. V2n-1 7 Út. 


Ebből a sétából a kitérők levágásával fogunk Hamilton-kört kapni. Először is meg- 
jegyezzük, hogy a listán Ka minden csúcsa szerepel, és a listán szomszédos két 
csúcs között él fut T-ben. Az is igaz, hogy a 7 egy éle pontosan kétszer fordul 
elő mint a körsétán szomszédos csúcsok közötti él. Ebből következik, hogy a (x) 
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körséta összsúlya éppen kétszerese a T összsúlyának, azaz 25. Ezután a (4) men- 
tén haladva megadjuk a Ka egy F Hamilton-körét. Legyen a kiindulópont u. Elég 
megadni azt a sorrendet, ahogy a Ka pontjait F-ben az u pontból indulva végig- 
járjuk. Tegyük fel, hogy az u — ti, üz, . . . , 4 pontokat már kiválasztottuk. és 
u — vi Legyen j 5 ia legkisebb olyan index, melyre teljesül, hogy v; nincs 
Az u, uz, . . , , uk pontok között. Ha van ilyen j, akkor legyen ugyi :— v;. Ha 
nincs ilyen j, akkor szükségképpen k — n és a munkát befejezzük az un41 :— u 
választással. Minden csúcs szerepelni fog F-ben, hiszen a (3) lista tartalmazza a 
Kea összes pontját. Az u-t kivéve minden pont egyszer szerepel, tehát F tényleg 
Hamilton-kör. 


Mit mondhatunk az F Hamilton-kör összsúlyáról? Ez a mennyiség legfel- 
jebb akkora mint a (x) séta összsúlya, hiszen — az előző jelöléseket megtartva — 
a háromszög-egyenlőtlenség miatt 


d(ux tk41) S dívi, vís1) tk dívi41, Vi42) FF d(vj-1, wz). 


Az F összsúlya ezért legfeljebb 25. Mennyire lesz ez jó közelítése a minimum- 
nak? Egy Hamilton-körből egy élet elhagyva feszítőfát kapunk, aminek az össz- 
súlya legalább s. Ebből következően bármely Hamilton-kör súlya is legalább s. A 
módszerünk tehát kettes szorzó erejéig közelíti az optimális értéket. 


Megjegyzés: A módszer Jelke a (x) bejárás konstrukciója, amit a T" gráf segít- 
ségével vittünk végbe. Ez a lépés szemléltethető úgy, hogy a T fát lerajzoljuk a 
síkba, majd az u csúcstól elindulva végigsétálunk az ágai mellett. Képzeljük el. 
hogy a bal kezünkben egy ecsetet tartunk, és ezt a séta során végighúzzuk a T 
élei, a leveleknél visszafordulva a ,. másik oldalra". A séta akkor ér véget, amikor 
minden él mindkét oldalát befestettük. Ekkor éppen az u pontba érünk vissza. A 
sorrend, ahogy a gráf csúcsait elérjük, megfelel a T" egy Euler-körútjának. 

A vázolt fabejáró módszer neve Lindström-bejárás. Bizonyos csúcsokat eset- 
leg többször is meglátogat, de igen hatékonyan megvalósítható. Elsősorban a kö- 
vetkező tulajdonsága miatt használják belső memóriabeli listák kezelésére. 





Feladat: Legyen T egy bináris fa, u a gyökere. Mutassuk meg, hogy az u-ból 
induló Lindström-bejárás megvalósítható lineáris idejű, konstans munkaterületet 
használó algoritmussal (így pl. akkor is, ha nem használhatunk vermet, és nem 
írhatunk a fa csúcsaiba). 
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9.4.  Véletlent használó módszerek 


És mikor előállatta volna a Sámuel az Izráelnek minden nemzetségit, 
találák ki sors által az Benjámin nemzetségét. Azután az Benjámin 
nemzetségét előállatá, mindent az ő háza népével, és találák kivenni 
az Márri nemzetségének sorsát, és azok közül találák az Sault, az Kis- 
nek fiát... SÁMUEL ELSŐ KÖNYVE, 10: 20-21. 


Itt olyan számításokról lesz szó, melyekben megengedünk valamiféle véletlen vá- 
lasztásokat. Az ilyen algoritmusok furcsa sajátossága, hogy a bemenet és az algo- 
ritmus maga nem határozzák meg egyértelműen a tényleges lépéseket, a számítási 
időt, olykor magát a végeredményt sem. Mindezekért a bizonytalanságokért bősé- 
gesen kárpótol bennünket a véletlent használó (szokásos szakkifejezéssel: rando- 
mizált) módszerek hatékonysága és eleganciája. 

Egy példával már találkoztunk. A gyorsrendezés ideje nagymértékben függ at- 
tól, hogy a partícionáló elemek mennyire vágják egyforma darabokra a tömböt. A 
partícionáló elemek véletlen választásával az esetek jó részében elég egyenletes 
vágást kapunk. Gyakorlati szempontból a gyorsrendezés randomizált változata a 
legjobb az ismert általános rendező módszerek közül. A randomizálás nem csak 
a könnyű feladatok megoldásakor jön szóba. Látni fogjuk, hogy így olyan prob- 
lémák kezelésére kaphatunk hatékony módszereket, melyekre nem ismert gyors 
hagyományos algoritmus (Turing-gép, RAM program). 

A randomizált módszerekkel szemben két érvet szokás felhozni. Az egyiket 
már érintettük: a bizonytalanság, a hiba lehetősége mintegy bele van tervezve 
ezekbe a módszerekbe. Mint látni fogjuk, ettől nem kell igazán félnünk. Gondol- 
junk arra, hogy a számítógépek, amelyeken a determinisztikus módszereink fut- 
nak, szintén nem mentesek a hiba lehetőségétől. Azt mondhatjuk, hogy egy bizo- 
nyos kis pozitív valószínűséggel hibásan működnek. A kérdés ezután már csak az, 
hogy le tudjuk-e szorítani erre a szintre a randomizált módszereink hibázási való- 
színűségét. (Sokkal ez alá menni nem érdemes, hiszen ezek a módszerek is a mi 
gyarló számítógépeinken futnak). A válasz a kérdésre sok érdekes esetben igenlő: 
a hibavalószínűség hatékonyan tetszőlegesen kicsivé tehető. 

A másik ellenérv elvi szempontból súlyosabb. A randomizált módszerek elem- 
zésénél, viselkedésük vizsgálatakor hallgatólagosan feltesszük, hogy valamiféle 
s igazán véletlen" bitek kellően hosszú sorozatával rendelkezünk, mégpedig általá- 
ban nulla költséggel. Valójában nem világos, hogy mit tekinthetünk véletlen soro- 
Zatnak, és az még kevésbé, hogy nyerhetünk-e ilyet egyáltalán valamilyen termé- 
szeti folyamatból. Nem célunk itt ezeket a filozófiába nyúló kérdéseket taglalni; 
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izgalmasak ugyan, de tudomásunk szerint kevés algoritmikus tanulsággal szol- 
gálnak. Gyakorlati szempontból mindez sokkal biztatóbban néz ki: a randomizált 
módszerek nagyon jól működnek a rendelkezésre álló egyszerű, olcsó álvéletlen 
sorozatokkal, Ennek a széles körben megfigyelt kedvező jelenségnek az okát még 
nem érti a számítástudomány. 

Az első példánk egy olyan feladat lesz, melyre nem ismert hatékony hagyomá- 
nyos algoritmus. Ez a probléma a polinomazonosságok tesztelése. 


Probléma: Adott behelyettesítéssel egy n-változós f € Zf[xai,..., Tn] egész 
együtthatós polinom. Tudjuk, hogy deg f £ d. El akarjuk dönteni, hogy f azo- 
nosan nulla-e. 


A feltétel, hogy f behelyettesítéssel adott, azt jelenti, hogy f-fel egyetlen dol- 
got tehetünk: értékeket adhatunk a változóinak, és ekkor valamilyen rendelkezé- 
sünkre álló eljárás megadja f értékét az adott behelyettesítésnél. Az eljárást úgy te- 
kinthetjük, mint egy fekete dobozt. Bemenetként adunk neki egy egész komponen- 
sekből álló a — (a1,. . . , an) vektort; válaszul a doboz kiadja az f(os, . . . , an) 
értéket, Ez az első látásra furcsának tűnő helyzet könnyen előfordulhat. Megeshet 
például, hogy f olyan kifejezéssel adott, amit nem lehet gyorsan kifejteni (vagy 
más, céljainknak megfelelő módon átalakítani), ugyanakkor könnyű a változók 
adott értékeire f-et kiszámítani. Például tekintsük az 


f(z1, 72... 32) s (mi 72)(zs tz4) tt (72-i Zan) 


polinomot. Ezt kifejtve 2" tagot kapunk, viszont egy helyettesítési érték n Összea- 
dással és n — 1 szorzással megkapható. Hasonló a helyzet a következő, változókból 
álló determinánssak: 


D - det 


A D-t kifejtve n! tagot kapunk, ugyanakkor bármely helyettesítési értéke 
0(n?) aritmetikai művelettel megkapható (Gauss-elimináció), Mindkét polinom 
foka n, a behelyettesítés gyors és könnyű, a kifejtés nehéz, hiszen túl nagy a vég- 
eredményben a tagok száma. 

Problémánkat megfogalmazhatjuk úgy is, hogy a d fok függvényében minél 
kevesebb behelyettesítéssel tanút szeretnénk arra, hogy f / 0. Tanún egy a — 
(aa, . . . , an ) egészekből álló vektort értünk, melyre f(a) 7 0. 

A következő tétel annak pontos megfogalmazása, hogy ha f Á 0, akkor egy 
véletlenül választott a jó eséllyel tanú lesz. Ez szemléletesen nyilvánvaló. Kép- 
zeljük el az n — 2 esetet, amikor is f-nek két változója van. Ha f - 0, akkor a 
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1(81. 82) € R2; f(B1, 82) s 0) halmaz egy görbe a síkon. Világos, hogy a görbe 
a sík majdnem minden pontját elkerüli. Egy véletlen pont i eséllyel tanú lesz. 
A szokásos módon Prot( A) jelöli az A esemény valószít ét. 





Tétel (J. Schwartz lemmája): Ha degf £ d. és az, . . . , an egyenletes elosz- 
lású, egymástól független véletlen elemei az (1, . . . , N) számhalmaznak, akkor 
f 0 esetén Prob(f(a)—0) S 4. 


Bizonyítás: Indukció n szerint. n — 1 esetén f-nek legfeljebb d gyöke van, így 
Prob(f(cn) — 0) c $. Legyen n 5 1. Fejtsük ki f-et xz szerint, és legyen 
y — (2, . . . , tn). Ezzel a jelöléssel 


f(z) — holy) 4 hilyjzi ket haly] ai, 


aholk £ dés hr Z 0. Ha ffa) — 0, akkor vagy az igaz, hogy hr(a2, . . . , an) — 
0, vagy pedig az, hogy h(a2, . . . , an) A 0 és fia, €2, . . . an) — 0. Mit mond- 
hatunk e két nemkívánatos esemény valószínűségéről? 

Tekintetbe véve, hogy deghk £€ d — k, az indukciós feltevés szerint 
Prob(hr(la2,... an) 50 e ak, Ha pedig (o, . . . , an) rögzített úgy, hogy 
hr(or2,... an) sz 0, akkor Prot(f(a1,c2..:..0n) — 0 S 4. hiszen az 
02, . . . , an, értékek behelyettesítése után kapott egyváltozós polinom foka k. 

Annak a valószínűsége, hogy a két nemkívánatos esemény valamelyike bekö- 
vetkezik, legfeljebb a két esemény valószínűségének az összege, ami nem több, 
mint d 44 s g$.O 





Következmény: Az (1,2,...,2d) halmazból vett véletlen n-komponensű a vek- 
tor esetén Prat(f(a) A 0) 2 1/2. ha f A 0. Ekkora halmazból választva tehát 
legalább 1/2 valószínűséggel adódik tanú. Ha t-szer függetlenül választunk ilyen 
helyettesítést, akkor legalább 1 — 3 valószínűséggel kapunk tanút. Ö 








Ahhoz. hogy találjunk egy tanút, várhatóan 2 kísérlet elegendő. Ha az f po- 
linom T időben kiértékelhető (1, 2, . . . , 2d)-beli az értékekkel, akkor várhatóan 
2T időben adódik tanú. Általában véve tf időköltséggel 1 — Fa valószínűséggel 
találhatunk tanút. 

Térjünk itt vissza egy kicsit a randomizált módszerek megbízhatóságával kap- 
csolatos kifogáshoz! Képzeljünk el egy roppant megbízható számítógépet. Mond- 
juk olyat, ami ezer esztendőnyi folyamatos működés során csak egyszer hibázik. 
(Ennyi idő alatt csak történik valami, ami megzavarja: közeli villámcsapás, üstö- 
kös felbukkanása, tatárdúlás, stb.) Tegyük fel, hogy ez a hiba egy adott időintérval- 
lumba annak hosszával arányos eséllyel kerül. Ekkor annak a valószínűsége, hogy 
a hiba a következő ezredmásodpercben lép fel, nagyvonalúan becsülve is legalább 
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(1/29"9. Az előző eljárást 60-szor ismételve a hibás döntés esélye ennél sokkaj 
kisebbé tehető. A t alkalmas (és nem túl nagy) választásával tehát elérhetjük a 
hagyományos algoritmusok biztonságát. 


Nézzük ezután a Schwartz-lemma egy alkalmazását. Legyen G — (LU; E) 
páros gráf, L — íli,... Inj és UV — (u1,..., tn). Az M — (mig) n-szer n-es 
mátrixot az alábbi módon értelmezzük: 


m.zf S ha (tu) € E, 
37 0 különben. 


Az M mátrix elemei tehát nullák és független változók. Annyi különböző vál- 
tozó szerepel, ahány éle van G-nek. 


Tétel: G-ben akkor és csak akkor van teljes párosítás, ha det M - 0. 


Bizonyítás: A determináns egy tagja kifejtés után mir m2zt2) tt Mnmin) 
alakú, ahol 7r az 1, . . . , n számok egy permutációja. Ha egy ilyen tag nem 0, akkor 
(un) € E,i — 1,...,n, így ezek az élek teljes párosítást adnak. Ha tehát 
G-ben nincs teljes párosítás, akkor det M — 0. Ha viszont van G-ben teljes pá- 
rosítás, akkor annak egy nem 0 kifejtési tag felel meg. Különböző kifejtési tagok 
nem ejthetik ki egymást, mert bármely kettőben van két különböző változó. Tehát 
ekkordet M £0.0 


A det M polinomra alkalmazhatjuk az előbbieket. Véletlent használó (rando- 
mizált) módszert kapunk annak eldöntésére, hogy van-e G-ben teljes párosítás. 
Nézzük az eljárás költségét. Itt deg det M — n, az a; elemeket az (1, 2, . . . ,.2n) 
halmazból választhatjuk. A Schwartz-lemma szerint ha det M Z 0, akkor egy 
helyettesítés legalább (1/2) valószínűséggel tanút ad. Egy kiértékelés (Gauss- 
elimináció) 0(n?) aritmetikai művelettel (--, —, x, /) elvégezhető. A fellépő szá- 
mok mérete a számítás alkalmas szervezése mellett legfeljebb log, n(2n)", ami 
O(nlogn). A módszer tehát várhatóan polinom időben! eldönti, hogy van-e G- 
ben teljes párosítás. 

Érdekességként megemlítjük az előző tétel általánosítását (bizonyítás nélkül) 
tetszőleges irányítatlan gráfokra. 


! Az Oivasóban felmerülhet a kérdés, hogy miként viszonyul az itt bemutatott randomízált algo- 
ritmus hatékonysága a magyar módszeréhez. Bizonyítás nélkül megemlítjük, hogy - további ötletek 
alkalmazásával - a módszer várható futási ideje levihető O(n?)-ra. Ez sűrű gráfok esetén elvben 
versenyképes a König-módszer idejével, sőt a Hopcroft-Karp-algoritmuséval is. A gyakorlatban 
azonban erre a feladatra ma jobbnak tűnnek a gráfelméleti hátterű algoritmusok. 
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Tétel (Tutte tétele): Legyen G — (VE) egy irányítatlan gráf V 0 — 
(01... ., ün). Legyen T — (tip) a következő mátrix: 





xi  ha(wvj) e Eésicj 
tiz $ —zig halwgvj) e Eésisj, 
0 különben. 


A G gráfban pontosan akkor van teljes párosítás. hadet T $ 0. 


A páros gráfokra javasolt randomizált módszer minden nehézség nélkül mű- 
ködik az általános esetben is. Ekkor det T lesz a polinom, amihez tanút keresünk. 


9.4.1. Az RP nyelvosztály 


Köszönöm, kedves véletlen, fogadd hálás köszönetemet! 
SOREN A. KIERKEGAARD: Vagy-vagy" 


A hagyományos számítások hatékonyságának értelmezésében hasznosak voltak az 
idő- és tárkorlátokkal megadott nevezetes nyelvosztályok. Most abból szeretnénk 
rövid ízelítőt adni, hogy a randomizált számítások miként férnek ebbe a keretbe. 
Olyan nyelvosztályt definiálunk - ez lesz az RP osztály -, melynek a nyelvei haté- 
konyan felismerhetők randomizált (véletlent használó) algórítmusokkal. 


Definíció: Az L C I" nyelv az RP nyelvosztályba tartozik, ha van olyan La € P 
nyelv és c 2 0 állandó, hogy 

(1) L— (ze It és van olyan y € TP" szó, melyrely]-l elf és(zy € ZD) 
(ii) haz € L, akkor az ) a 19 hosszú y € IT" szavaknak legalább a felére teljesül, 
hogy (x,y) E La. 


Vegyük észre, hogy az (i) tulajdonság éppen azt fejezi ki, hogy L € NP. Az 
RP-beli nyelvek tehát egyben NP-beliek is: RP GC NP. Ha viszont az L nyelv 
polinom időben felismerhető, akkor az Li ((z.1ixr € L) nyelvvel és a 
c — 0 állandáóval teljesülnek a definíció kikötései, vagyis ekkor L € RP is igaz. 
APC RPC NP tartalmazási relációkról azt gondoljuk, hogy valódiak; széles 
körben elfogadott sejtés szerint az RP nem esik egybe sem a P, sem pedig az NP 
nyelvosztállyal. 

Legyen L € RP. Az L4 nyelv és egy neki megfelelő polinom idejű algorit- 
mus ismeretében az L felismerésére a következő egyszerű randomizált (véletlent 


? Johannes szavai amikor hosszú keresgélés után végre rábukkant Cordéliára. 
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használó) algoritmus kínálkozik. Legyen z € I" egy input szó. El kelt döntenünk, 
hogy z € L teljesül-e. Válasszunk egy véletlen y € I" szót, melynek hossza Izgi", 
és döntsük el az ((z,y) € Li?) kérdést. Ha a válasz igenlő, akkor x € L, ellen- 
kező esetben a következtetésünk: , valószínűleg z 7 L". Vegyük észre, hogy az 
(i) feltétel miatt az igenlő válasz mindig helyes. Ha van tanú, akkor az x szó az 
L nyelvbe tartozik. A nemleges válasz lehet hibás. Előfordulhat, hogy z € L tel- 
jesül ugyan, de rossz tanújelölt akadt a kezünkbe, Az (ii) feltétel szerint azonban 
ennek a balszerencsének a valószínűsége legfeljebb 1/2. Nevezzük az itt vázolt 
módszert RP-tesztnek. A hibázás valószínűsége tetszőlegesen kicsivé tehető a már 
megismert módon: t darab függetlenül választott y kipróbálása után legfeljebb dr 
a téves következtetés valószínűsége. Mivel Li € P és y hossza az z hosszában po- 
linomiális, egy ilyen teszt polinom időben elvégezhető. Az (r € L?) kérdés tehát 
várhatóan polinom időben megválaszolható. 


Megjegyzés: A randomizált módszerek költségének a tanulmányozásakor nem 
vettük számításba a , véletlen választások" költségét. A gyakorlatban ezek a vá- 
Jasztások álvéletlen objektumok (számok, bitek) generálását jelentik. Itt csak meg- 
említjük, hogy vannak gyors módszerek, melyek elég jó (megfigyelt) viselkedésű 
álvéletlen objektumokat eredményeznek. 


Igen érdekesek a Las Vegas :— RP NN coRP osztályba tartozó nyelvek. Ha 
L € Las Vegas, akkor definíció szerint L € RP és [7 — I" YI € RP. Nézzük, 
mi történik, ha egy z € I" bemenő szóra lefuttatunk egy-egy RP-tesztet mind az 
(a € L?), mind pedig az (z e L"?) kérdésre. Ezt megtehetjük, mert L és L/ is RP- 
beli nyelv. Ezek közül csak az egyik adhat igenlő eredményt, hiszen z pontosan 
az egyik nyelvnek eleme. (Az (i) feltétel miatt az RP-teszt nem tud úgy lódítani, 
hogy a nyelvbe nem tartozó szóról azt állítja, hogy benne van.) Ha valamelyik 
tesztre igen a válasz, akkor készén vagyunk. Mi van akkor, ha egyik teszt sem 
adott igenlő választ? Az (ii) feltételt alkalmazva az L és L" közül arra, amelyik- 
nek z eleme, látjuk, hogy ennek a valószínűsége legfeljebb 1/2. Két nem esetén 
tehát arra következtethetünk, hogy a tesztek nem jártak eredménnyel. A tesztek 
ismétlésével ennek a valószínűsége gyorsan lecsökkenthető. A lényeges különb- 
ség a szimpla RP-teszthez képest, hogy itt sosem kapunk helytelen eredményt. Ha 
egyik teszt sem adott igenlő választ, akkor úgy vehetjük, hogy tovább kel! próbál- 
koznunk az igazság kiderítésével. Az itt vázolt Las Vegas-teszt becsületes abban 
az értelemben, hogy sosem ad hamis választ a kérdésre. A Las Vegas-teszt jellem- 
zőit így foglalhatjuk össze: gyors (polinom idejű), nagy valószínűséggel válaszol 
az (íg € L?) kérdésre, és a válasza mindig helyes. 


Az RP nyelvosztály definíciójában az (ii) feltételt úgy is fogalmazhatjuk, hogy 
ha r € L, akkor az Ír]" hosszú szavak közül választott véletlen y szó legalább 
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(1/2) valószínűséggel tanú lesz. Legyen p egy tetszőleges, rögzített, nem szél- 
sőséges valószínűség, azaz legyen 0 c p c 1. Az RP-beli nyelv definíciójában 
cseréljük ki az (ii) feltételt a következőre: 
fii") Haz € L, akkor egy vélettenül választott ) x 1" hosszú y e I" szára legalább 
p valószínűséggel igaz, hogy (x,y) € La. 


Feladat: Mutassuk meg, hogy ha a definícióban az (ii) feltétel helyett az (ii") fei- 
tételt használjuk, akkor is éppen az RP-beli nyelveket kapjuk. 


Megemlítjük még, hogy a randomizált módszerek számítási ereje nagyobb a 
Turing-gépekénél. Tegyük fel ugyanis, hogy a (binárisan) adott n egész bemenetre 
találnunk kell egy olyan z € I" szót, melyre C(x) 2 n/2 (itt C(x) az z szó 
Kolmogorov bonyolultsága). Véletlen választással könnyen célt érünk: az olyan 
n hosszú x szavak száma, melyekre C(r) £ n — 2. kisebb mint 2771, tehát egy 
véletlenül isztott n-hosszú 2 szóra legalább 1/2 valószínűséggel teljesül, hogy 
C(m)5n-2 

Másfelől nincs olyan M TG, mely az n bemenetre olyan M(n) szót ad, 
melyre O(M(n)) 2 n/2. Ellenkező esetben az invariancia-tételből C(M(n)) c 
Cm(íM(n)) 4 e £ flogo2(n -- 1)] 4 c. Ezek összevetéséből pedig n/2 £ 
Mogz(n - 1)1 -- c adódna, ami képtelenség, ha n elég nagy. 






9.4.2. . Prímtesztelés 


Tegyük fel, hogy bemenő adatként adott (binárisan) egy m páratlan egész; szeret- 
nénk eldönteni, hogy m prímszám-e. A feladat az elvi érdekességén túl gyakorlati 
szempontból is fontos. A biztonságos kommunikáció céljait szolgáló algoritmu- 
sok gyakran használnak igen hosszú — olykor többszáz-jegyű — prímeket. Hamar 
meggyőződhetünk róla, hogy ilyen nagy m-nél a kézenfekvő (exponenciális idejű) 
módszer, hogy m-et sorban elosztjuk a V/m-nél kisebb természetes számokkal, 
nem fér bele az időnkbe. 

A feladat tehát a I nyelv felismerése. Erről eddig annyi derült ki, hogy jól 
karakterizált: II € NP 0 coNP. Azt is megemlítettük, hogy eddig nem találtak a 
megoldására polinom idejű módszert. 

A prímszámok felismerésére szolgáló eljárásokat prímteszteknek szokás ne- 
vezni. Itt egy hatékony randomizált prímtesztet szeretnénk bemutatni. A módszer 
valójában egy RP-teszt lesz a prímtulajdonság komplementerének, az összetettség- 
nek a felismerésére. 

Először egy olyan módszert ismertetünk, ami szemléletes ugyan, de van egy 
kis fogyatékossága. Mint látni fogjuk, ez a fogyatékosság a módszer finomításá- 
val kiküszöbölhető. Az algoritmus (Fermat-teszt) a kis Fermat-tételen alapul. Az 
egyetlen bemenő paramétere a binárisan leírt m 2 2 páratlan egész. 
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Fermat-teszt (m) 

1. Válasszunk egy véletlen a egészet az (1, m) intervailumból. 

2.Haar-! zs 1 (mod m), akkor a válasz ,m valószínűleg prím", különben a 
válasz ,m összetett". 


A teszt gyorsan (log; m-ben polinomiális időben) végrehajtható: az a77! 
(mod m) hatványt a korábban említett gyors hatványozással kaphatjuk meg ha- 
tékonyan. 

Vegyük észre, hogy ha az eredmény az, hogy m összetett, akkor ez biztosan 
helyes. Ezt a tényt a tanúsítja, hiszen a 2. lépésben kiderül, hogy a-ra nem teljesül 
a Fermat-kongruencia. Ezért ekkor azt mondjuk, hogy a az m összetettségének 
Fermat-tanúja. 


Példa: Legyen m — 21 — 7: 3 és a — 2. Ekkor a az m Fermat-tanúja, hiszen 
2974 (mod 21). 


A Fermat-tanúk számáról szól a következő állítás. 


Állítás: Ha m-nek van olyan a Fermat-tanúja (1 £ a c m ésa £1 
(imod m)), melyre Inko(a,m) — 1, akkor az (1, m) intervallum egészeinek leg- 
alább a fele Fermat-tanú, 


Az állítást úgy is értelmezhetjük, hogy ha m összetettségének van olyan a 
Fermat-tanúja, melyre Inko(a, m) — 1, akkor a teszt legalább 1/2 valószínűséggel 
talál Fermat-tanút. 


Bizonyítás; Ha Inko(a,m) 5 I, akkor a nyilván Fermat-tanú. Elég ezért látni, 
hogy a redukált maradékosztályok (amelyekre teljesül, hogy Inko(a, m) — 1) leg- 
alább fele Fermat-tanú. Legyen G a mod m redukált maradékosztályok halmaza 
és 
H :— nem Fermat-tanúk — (be Gb"! z1 (mod m)) 

Legyen a € G egy (a feltételünk szerint létező) Fermat-tanú, és tekintsük a Ha :— 
(ba; be H) C G halmazt. Ha b és b" két különböző maradékosztály, akkor ba 
ta (mod m), mert a és m relatív prímek. Ebből arra jutunk, hogy [ H 1-1] Ha I. 

Másfelől Ha C GW H, hiszen egy H-beli maradékosztályt Fermat-tanúval 
szorozva ismét tanút kapunk. Mindezek alapján 





IHJI-I Hasi GYH], 


azaz] H ig 3 I G I. Tehát a G elemeinek legalább a fele Fermat-tanú. CI 


A módszer hátulütője, hogy vannak olyan m összetett számok, melyekre egy- 
általán nincs olyan a Fermat-tanú, melyre Inko(a, m) — 1. Ezek az úgynevezett 
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pszeudoprímek, vagy Carmichael-számok. Ilyen például az 561 — 3-11-17. Újabb 
eredmény (W. R. Alford, A. Granville, C. Pomerance, 1992), hogy végtelen sok 
ilyen szám van. Hogyan ellenőrizhetjük, hogy 561 tényleg egy Carmichael-szám? 
Emlékeztetünk itt a kínai maradéktételre. 


Tétel (kínai maradéktétel): Legyenek mi,...,mx páronként relatív prím, 
€1, . . . , ax tetszőleges egészek. Ekkor az 


zza (mod m1),...,T zar (mod m,) 


kongruencia rendszernek van egész xr megoldása. Az xz megoldás modulo 
mama " : : mg egyértelműen meghatározott. 


Visszatérve példánkhoz: meg kell mutatni, hogy ha Inko(a, 561) — 1, ak- 
kor a5$0 — 1 (mod 561). A kínai maradéktétel szerint elég, ha az a$60 sz 1 
(mod 17), a5§0 z 1 (mod 11) és a5f0 — 1 (mod 3) kongmenciákat igazol- 
juk, feltéve, hogy a relatív prím a szóban forgó modulushoz. Nézzük meg az elsőt; 
a többi hasonlóan kezelhető. Mivel 560 — 16 - 35, 


35 
a560 al6 35 16y 





15-1 (mod 17). 


E (a 


Az utolsó előtti kongruencia a kis Fermat-tétel következménye. 

Érdemes megjegyezni azt a módot, ahogy itt a kínai maradéktételt használtuk. 
Modulo mim? : : : my számítás helyett elegendő volt modulo m; (1 £ ig k) 
számolni. Ezt az ötletet széles körben alkalmazzák a számítógépes aritmetikában, 
különösen a nagy pontosságú számítások területén. 


E kis kitérő után kanyarodjunk vissza a prímteszteléshez. A Fermat-teszt fo- 
gyatékossága, hogy ha m Carmichael-szám, akkor m-et a teszt nagy eséllyel prím- 
nek deklarálja. Most a Fermat-teszt olyan javítását ismertetjük, ami kiküszöböli ezt 
a problémát. A módszert Rabin-Miller-tesztnek nevezik. 


Definíció: Legyen m egy páratlan természetes szám. Írjuk felm — 1-etm—1 — 
2tn alakban, ahol n páratlan. Az 1 £ a c m egész Rabin-Miller-tanú (m össze- 
tettségére), ha az 

a" —1, at 41 at pl... adni 


számok egyike sem osztható m-mel. 


Tétel: Ha m prím, akkor m-hez nincs Rabin—Miller-tanú. 
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Bizonyítás: Legyen a egy tetszőleges egész az [1, m) intervallumból. Az 
ami 1 s (anyat (at 1). ran 1) 


azonosságot használjuk. Mivel m prím, a kis Fermat-tétel szerint m osztja a bal 
oldalon álló számot, Ugyancsak m prímvoltából következik, hogy m ekkor osztja 
a jobb oldai valamelyik tényezőjét, ami azt jelenti, hogy a nem Rabin-Miller-tanú. 
a 


Az is látszik az azonosságból, hogy ha a nem Rabin-Miller-tanú, akkor nem 
lehet Fermat-tanú sem. Ugyanis ha a jobb oldali számok valamelyike osztható m- 
mel, akkor a bal oldal is osztható m-mel. Ezt pozitívba fordítva úgy is mondhatjuk, 
hogy egy Fermat-tanú egyben Rabin-Miller-tanú is. Az új definíció tehát tágítani 
igyekszik a lehetséges tanúk körét. A következő állítást úgy is olvashatjuk, hogy ez 
a bővítés sikerült: ha m összetett, akkor ennek a ténynek sok Rabin-Miller-tanúja 
van. 


Tétel: Ha m összetett, akkor az 1 £ a a m feltételt teljesítő a egészeknek leg- 
alább a fele Rabin—Miller-tanú. 


A bizonyítást mellőzzük; csak annyit jegyzünk meg, hogy a lényeg annak az 
igazolása, hogy van egyáltalán m-hez relatív prím Rabin-Miller-tanú. Utána a 
Fermat-tesztnél látott érveléssel következik, hogy sok tanú van. A Rabin-Miller 
összetettségi teszt a Fermat-teszt kézenfekvő módosítása: Fermat-tanú helyett 
Rabin-Miller-tanút választunk. 


RM(m) 

1. Írjuk fel m — 1-etm — 1 — 2n alakban, ahol n páratlan. 

2. Válasszunk egy véletlen a egészet az [1, m) intervallumból. 

3.Haaza?—1, at 41, a? a1,..., aZ nr 4 1 számok egyike sem osztható m- 
mel, akkor megállunk azzal a válasszal, hogy ,m összetett", különben megállunk 
azzal a válasszal, hogy ,m valószínűleg prím". 


Várhatóan 2 véletlen a érték választása után kapunk egy Rabin-Miller-tanút, 
ha m összetett. Ha t kísérlet után sem adódik Rabin-Miller-tanú, akkor m-et leg- 
feljebb dr tévedési valószínűséggel prímnek nyilváníthatjuk. Az RM -teszt, ugyan- 
úgy, mint a Fermat-teszt, gyors hatványozással valósítható meg hatékonyan. 


Következmény: Az összetett számok nyelve az RP osztályban van. 
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Bizonyítás: Legyen 


117 (ma) 





mo32 168 a c m egészek, és ha m páratlan, 
akkor a egy m-hez tartozó Rabin-Miller-tanú 


és c — 1. Ezekkel a választásokkal teljesülnek az RP-beliség (i) és (ii") feltételei, 
utóbbi ap — (1/4) valószínűséggel. Legyen ugyanis n az m bitjeinek száma. 
A tételből következik, hogy a legfeljebb n bittel leírható egészek legalább 1/4-e 
Rabin-Miller-tanúja lesz m összetettségének. O 


Könnyű meggondolni, hogy a módszer éppen az La nyelven alapuló RP-teszt 
az összetett számok felismerésére, Sokkal mélyebb eredmény (L. A. Adleman, 
M. D. Huang, 1987, a bizonyítás másfélszáz oldalnyi és pogányul nehéz), hogy 
II €ERP is teljesül. Maga a teszt polinom idejű ugyan, de olyan bonyolult, hogy a 
gyakorlatilag még érdekes méretű inputokon nem érdemes futtatni. Ezért prímtesz- 
telésre inkább összetettségi teszteket használnak. Ezek között a Rabin-Miller-teszt 
elég jónak számít, 

A két eredmény együtt azt jelenti, hogy II € Las Vegas. És még ennél is 
cifrább a helyzet. Egy sokat tanulmányozott, de mindeddig nem igazolt számel- 
méleti hipotézisből (az ún. általánosított Riemann-sejtés) következik, hogy ha m 
összetett, akkor van olyan a Rabin-Miller-tanú is, melyre a £ 210g? m (E. Bach, 
1990). Ha tehát a sejtés igaz, akkor II € P, hiszen ekkor elég tanút keresni az első 
210g? m természetes szám között. 





9.4.3. . Nagy prímszám keresése 


A későbbiekben szó lesz olyan módszerekről, amelyek nagy prímszámokat hasz- 
nálnak. Itt megmutatjuk, hogy véletlen választással könnyen találhatunk ilyeneket. 


Probléma: bemenő adatként adott egy n természetes szám. Keressünk egy n-jegyű 
prímszámot. 


A módszer igen egyszerű: válasszunk egy véletlen p egészet a [297127 — 1] 
intervallumból. Az RM-teszttel ellenőrizzük, hogy p prím-e, mondjuk 2750 hiba- 
valószínűséggel. Ez legfeljebb 60 véletlen a kipróbálását jelenti. Ha kiderül, hogy 
p nem prím, akkor új p-t választunk, 

Várhatóan hány p-t kell választani? Egy x 5 1 valós számra jelölje r(r) az 
Ü z] intervallumba eső prímek számát. A prímszámtétel szerint, x(z) — rogz ha 
xz — o0. Innen könnyen adódik, hogy a számunkra érdekes intervallumban a prí- 
mek száma :7 Hozz eJ2T— ha n elég nagy. Annak a valószínűsége ezért, hogy egy 
véletlen p prím lesz, körülbelül 5822, tehát 0(n) darab véletlen p kipróbálásával 
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várhatóan találunk egyet. A módszer várható költsége polinomiális az eredmény 
hosszához mérve, 


9.5.  Prekondícionálás 


GUCUACGGCCAUACCACCUGAACGOGOOCGAUCUCGUCUG 

AUCUCGGAAGCURAGCAGGGUCGGGCCUGGUUAGUACUUG 

GAUGGGAGACCGCCUGGGAAUACCGGGUGCUGUAGGCUU 
Az emberi 55 rRNS genetikai kódja 


Képzeljük el, hogy egy adott P algoritmikus problémának több példányát, mond- 
juk i:,i2,... , i-t kell egy feladat részeként megoldanunk. A kézenfekvő meg- 
közelítés az lenne, hogy veszünk egy jó algoritmust a P megoldására, amit sorra 
lefuttatunk az ii, ia, . . . , 4; bemenetekkel. Sok esetben ennél számottevően haté- 
konyabb módszert kaphatunk, ha először egy kis előkészítő munkát végzünk — 
szokásos kifejezéssel prekondícionáljuk P-t. A prekondícionálás olyan előkészítő 
tevékenység, aminek az eredménye többször felhasználható. Bizonyos feladatok- 
nál az előkészítő munka extra költsége több példány esetén megtérül, sőt az össz- 
költség csökken. Gyakran egész egyszerűen arról van szó, hogy az íj, 2, . . . , ip 
megoldásainak közös lépéseit kiemeljük, és előre elvégezzük. Ebben az értelem- 
ben a prekondícionálás hatékony munkaszervezési fogás. Előzetesen elvégezzük 
azokat a teendőket, amelyek a konkrét bemenetektől viszonylag függetlenek. 

Az ilyen módszerek tervezésekor figyelnünk kell az előkészítő fázis költsége- 
ire is. Csak akkor érdemes belevágni, ha az ij, íz, . . . ,ix megoldásának plusz az 
előkészítésnek a költsége versenyképes a kézenfekvő megoldáshoz viszonyítva. 
Ennek mérlegelésekor érdemes meghatározni k-nak azt a nagyságrendjét, amitől 
kezdve már gazdaságos a módszer. Ennyi általánosság után nézzünk néhány pél- 
dát: 





1. Ősiség fákban 
Tegyük fel, hogy T gyökeres, felfelé irányított fa (aminek az élei a gyökér felé 
mutatnak). A fa mint bemenet a csúcsaival és az apamutatókkal adott. A feladat T- 
beli (v, w) csúcspárokra eldönteni, hogy w leszármazottja-e v-nek. Egyetlen pár 
esetén a költségigény (uniform) lehet en is (ahol n a T csúcsainak száma és c 2 0 
egy állandó). Ugyanakkor alkalmas 0(n) költségű prekondícionálás után minden 
egyes kérdés O(1) költséggel kezelhető. 

Egy lehetséges ötlet, hogy minden v € T csúcs mellé feljegyezzük a v T-beli 
pre(v) preorder, illetve post(v) postorder bejárás szerinti sorszámát. Nyilvánvaló 
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ugyanis, hogy a v, w € T csúcsokra pre(wv) £ prelw) 8 v őse w-nek vagy v a 
w-től balra van T-ben. Ugyanígy post(v) 2 post(w) S v őse w-nek, vagy v a 
1w-től jobbra van T-ben. A két tényből adódik, hogy v őse w-nek pontosan akkor, 
ha pre(v) £ prefw) és post(v) 2 post(w). 

A kétfajta számozás O(n) időben megkapható. A számok ismeretében egy 
(v, w) párra a kérdés két összehasonlítássai megválaszolható. Ha a bemenetként 
adott párok száma (a bevezetőbeli k: érték) nincs konstans korlát alatt, akkor érde- 
mes ezt a bonyolultabb módszert használni, Például ha a párok száma k — logn, 
akkor a kézenfekvő módszer költsége en log n is lehet; a prekondícionált időigény 
viszont O(n -4- logn) — 0(n). 


2. Polinom ismételt kiértékelése 
Adott az f(x) z 2? éséK 4... an € Z[2] polinom, és a bi, ba, . . . , ba egé- 
szek. Célunk az f(bp), . - Jé értékek kiszámítása minél kevesebb szorzássál, 
Mennyibe kerül itt a kézenfekvő módszer? Először kiszámítjuk a Us 4; 08 sss 
hatványokat, (n— 1 szorzás), majd az an-1bi, an-2bb, . .., mb! számokat (n-1 
szorzás). Összesen ez 2k(n — 1) szorzás. 
Javítást jelent a Horner-elrendezés alkalmazása: f(x) felírható 


f(2)— (e (((zkajz a2)z b ag) zt an 


alakban (összesen n—1 zárójelpár van). Így végezve a számítást, f(b;)-tn—1 szor- 
zással kapjuk. Az összköltség k(n — 1) szorzás, ami fele az előzőnek. A Horner- 
elrendezés szerinti alakra való átalakítást is felfoghatjuk prekondícionálásnak. 
Ezután egy még finomabb prekondícionálást használó megoldást mutatunk be. 
Az egyszerűség kedvéért tegyük fel, hogy deg f — n — 2! — 1, valamely t termé- 


szetes számra, Írjuk fel f-et 


f(x) — (Pr a)álr) 4 fe) 


alakban, ahol a € Z, az fi. fa egész együtthatós, 1 főegyütthatós polinomok, és 
deg f; — deg fo — 27!-—1., Az fi együtthatói, az a egész, majd pedig f2 együttha- 
tói egyszerű együttható összehasonlítássai megkaphatók. Az a értékét tudjuk úgy 
választani, hogy f2 főegyütthatója I legyen. Végezzük el ugyanezt a felbontást az 
fi. fa polinomokra, majd a belőlük kapott újabb polinomokra, stb., amíg ez le- 
hetséges. Végeredményben összesen t ilyen menetben kifejezzük f(x)-et z7 4 b, 
(b egész) alakú polinomok szorzatainak összegeként. Egy menetben összesen n új 
együtthatót kell meghatározni. 








Példa: Nézzük az f(x) — r7--25 4241 polinom felbontását. Itt n — TésvE 53. 
Az első lépés után f(r) — (1 —1 (29 4r) tr 43241, azaz fi(a) — 29 te, 
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és folz) — 79 43241 Ekét polinomot tovább bontjuk (t — 2). Az eredmény: 
f(x) — (22 Dzés folz) — (5240 r4 ri 1. Végül 


J(29-(2—1(22 42-i (224241. 


Az f-nek az így kapott felírását használva egy kiértékelés 5 szorzást jelent. Két 
szorzással kapjuk az r? és r! hatványokat, majd elvégezzük a felbontásban sze- 
replő további három szorzást. 


"Vegyük szemügyre általánosabban is a felbontást használó kiértékelés költsé- 
gét. Legyen Mít) — az előbbi felbontás szerint a szorzások száma egy kiértéke- 
lésnél. Legyen továbbá Nít) — M(t) S 1 A kiértékelést a c helyen úgy fogjuk 
végezni, hogy először kiszámítjuk a 2, et, . seb " hatványokat (ez té — 1 szor- 
zás), utána pedig a felbontásból adódó 2 83 b alakú tényezőket szorozzuk össze. 
Az ilyen szorzások száma lesz N(t). Nyilvánvaló, hogy N(1) — 0. A felbontás 
definíciójából kiolvasható, hogy N(t) C 2N(t— 1) 4-1, hat 5 I, hiszen az 
fi(c) és fo(c) kiszámításához használt szorzásokon felül még egy további szorzás 
szükséges. A rekurzióból kézenfekvő indukcióval kapjuk, hog: gy N(t) c271 1. 
Innen az összes szorzások száma Mí(t) c 27! 41—2— 2-3 4 logín 41). A 
k darab kiértékelés összesen kez -- logoín -- 1)) szorzással elvégezhető. 





Feladat: Mutassuk meg, hogy a fenti séma szerinti egyetlen kiértékelésnél legfel- 
jebb §- összeadás elegendő. 





Megjegyzések: 

1. V. Pan egyik tételéből következik hogy egy n-edfokú f(z) polinom (f főe- 
gyütthatója tetszőleges) egyszeri kiértékeléséhez a legrosszabb esetben legalább n 
szorzás/osztás kell. 

2. Ismeretes olyan prekondícionált algoritmus is, amellyel egy helyettesítés [5 ]--2 
szorzással kiszámolható. Másfelől bármilyen jól prekondícionáljuk is a polinomot, 
mindig lesz olyan helyettesítés, ami nem kapható meg kevesebb, mint [2] szor- 
zással (E. G. Belaga tétele). 

3. Az egyszerűség kedvéért, hogy elég legyen csak a szorzásokra figyelnünk, nem 
foglalkoztunk az előkészítő munka költségével. A gazdaságos k értékek meghatá- 
rozásánál erre ís tekintettel kell lennünk. 


3. Mintaillesztés szövegben 

A feladat, amivel itt foglalkozunk, alapvető fontosságú a szövegeket tároló, kezelő 
rendszerek szemszögéből: egy adott jelsorozatot kell megkeresnünk egy hosszú 
jelsorozatban. Az ilyen és hasonló igények a közhelyszerű számítógépes alkalma- 
zások mellett (pl. keresők, szerkesztők) fontos szerepet játszanak a genetikai ku- 
tatások egyik irányzatában, ahol a genetikai kódot roppant méretű, az A,G,C.U,T 
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jelekből formált szavakkal modellezik. A következőkben az egyik leghatékonyabb 
ötletet mutatjuk be, melynek lényeges része a keresett minta prekondícionálása. 
Először fogalmazzuk meg pontosan a feladatot: 


Probléma: Adottak a E véges abc betűiből alkotott s — $1---8, ésm — 
mai: ma szavak (s;, m; € 2). Találjuk meg m első részszóként való előfordulá- 
sát az s szóban. 


Úgy is fogalmazhatunk, hogy a legrövidebb olyan z szót keressük, melyre 
alkalmas y szóval teljesül, hogy s — xrrny. Például az s — balalajka szóban az 
m 7 la minta a harmadik betűvel kezdődően fordul elő először részszóként, míg 
azm — lak szó egyáltalán nem fordul elő. 

Természetesen kínálkozik az a megoldás, hogy f — 1,2,....n — d 4- 1-re 
sorban megvizsgáljuk, hogy az s-nek az i-edik betűjével kezdődő d hosszúságú 
részszava egyenlő-e m-mel. Ez az eljárás legrosszabb esetben dín — d -- 1) betű- 
összehasonlítást igényel. 

Első hallásra talán meglepő, hogy van a feladatra ennél jóval gyorsabb mód- 
szer is. A Knuth-Morris-Pratt-algoritmus, amit ismertetni fogunk, lineáris idejű, 
vagyis 0O(n -- d) összehasonlítást használ. 


Definíció: Az y szó az xz szó kezdőszelete (végszelete), ha van olyan nem üres z 
szó, hogy yz — T (illetve zy — 2]. 





Definíció: szó az xz szó lábfeje, ha y az z leghosszabb olyan kezdőszelete, 
ami egyben végszelere is. (Az y tehát a leghosszabb olyan w szó, melyre alkalmas 
nem üres z, 2" szavakkal z — wz — ztw teljesül.) 








Például a bababa szó lábfeje baba. Egy szónak önmaga nem lehet a lábfeje. 
A továbbiakban a leírás szempontjából kényelmes lesz a C programozási nyelv- 
ből ellesett egyik jelölés. A szavakat egészekkel indexelt, típusú tömböknek is 
tekintjük. Így például az s szó második betűje hivatkozható mint s(2], a harmadik 
helytől az ötödikig terjedő részszava pedig mint s[3 : 5]. 

Mielőtt forró fejjel elkezdenénk az m szót az s különböző részeivel hason- 
lítgatni, először elemezzük, feltárjuk az m szerkezetét. Ezáltal bizonyos össze- 
hasonlítások eredményét többször ís felhasználhatjuk a keresésben, számottevően 
redukálva az összköltséget. A prekondícionálás az m szó előfeldolgozását fogja 
jelenteni, Pontosabban fogalmazva kitöltjük a P(1 : dj egész típusú tömböt, ahol 





PI az mi : j) szó lábfejének a hossza. 


A P kitöltésére szolgáló módszer egyszersmind takaros példa a dinamikus 
programozás alkalmazására, amennyiben a P már ismert részét használjuk a még 
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ismeretlen értékek meghatározására, Nyilvánvalóan P[1) — 0. A módszer leírása- 
kor kényelmes lesz még a P(0] — 0 megállapodás. Tegyük fel ezután, hogy j 5 1 
és a PÍl : j — 1) résztömböt már kítöltöttük. Ekkor Píj) így számítható: 





1.i:z j — I; Pfj) :— 0; PfOj :— 0; 
2. Ha m[j) — míP[i] -- 1) akkor legyen Pf] :— Pli) — 1, különben, 
hai 5 0, akkor legyen i :— Pl[í], és menjünk vissza a 2. lépésre. 





Az eljárás megértéséhez jelölje w az mf(1 : j) szó lábfejét és I a w hosszát. Az 
l értéket kell meghatározni, ugyanis P(j) — hwl. Először megjegyezzük, hogy a 
PLj) értéke nyilván legfeljebb Pfj — 1]-3-1 lehet, hiszen ha az m[1 : 1) szó azonos 
az m[j —14- 1 : j) szóval, akkor m(1 : 1— 1] — m(j— 241: j— 1) is igaz. 
Ennek a lehetőségét nézzük meg először a második sor összehasonlításával. Ha itt 
nemleges a válasz, akkor sem üres a kezünk. Tudjuk, hogy P[7) c Plj — 1), ami 
azt jelenti, hogy a wíl : 1 — E] szó kezdőszelete m(1 : Píj — 1]]-nek és végszelete 
az míj — Plj — 1] : j — 1] szónak. De az utóbbi két szó a P tömb definíciója 
szerint azonos: mil : Plj — 1) — m[j — Píj — 1] : j — 1]. Ezzel az észrevétellel 
1 meghatározását visszavezettük egy kisebb hasonló feladatra. A w ezután annak a 
szónak (is) a lábfeje, amit úgy kapunk, hogy az m(1 : P(j — 1j] szó végére fűzzük 
az míj] betűt. Ezt a visszavezetést valósítja meg az í :— P(i) értékadás. 





Példa: Vegyük szemügyre a módszer működését az m — ababaa bemenettel. Te- 
gyük fel, hogy a P[1 : 5] résztömböt már kitöltöttük, és éppen P[6] meghatáro- 
zásánál tartunk. Tudjuk tehát, hogy PÍS]J — P(2] — 0, Pí(3j — IL. Pf(4) — 2 és 
P(5] — 3. A keretes eljárás indításakor j — 6 és emiatt í — 5. A 2. sorban az m[6] 
és m[4] betűket hasonlítjuk össze. Mivel ezek nem egyeznek, az i — 3 értékkel 
térünk vissza a 2. sorba. A teszt eredménye újfent negatív: m[6] A m[2]. Ezáltal 
megint a különben ágra kerülünk, ahonnan az i :— 1 értékadás után jutunk a 2. 
sorba. Az összehasonlítás végre valahára egyezést mutat (m(1] — mí6] — a), tehát 
megtörténik a P(6) :— P(1] 4 1 — 1 értékadás. 


A PI] tömb kitöltésének időköltsége nyilvánvalóan arányos a szükséges be- 
tűösszehasonlítások számával, így csak az utóbbiakat számoljuk össze. Jelölje k; 
a Plj) számításához felhasznált betűösszehasonlítások számát. Ebbe PÍI : j — 1] 
költségét nem értjük bele. Először megmutatjuk, hogy k; C P(j—1]— P(j]--2. Vi- 
lágos, hogy a 2. sor tesztjét pont k5-szer hajtjak végre, hiszen a kódban csak itt van 
betűösszehasonlítás. Vizsgáljuk meg. hogy mi történik ezalatt a P(i) értékkel. Ez 
kezdetben P[j — 1], majd minden további ityen teszt előtt legalább eggyel csökken. 
A végső értéke, amit f-fel jelölünk, ezért nem lehet több, mint P(j — 1] — k; -- 1. 
Tudjuk azt is, hogy Píj] értéke vagy f 4-1 lesz, vagy f aszerint, hogy a legu- 
tolsó betűösszehasonlítás sikeres volt-e, vagy sem. (Utóbbi esetben f — 0.) Ezeket 
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összevetve P[j) £ Plj — 1) — k; -- 2, amiből k, S P(j — 1) — P[j] 4 2. 
Az összehasonlítások száma mármost 


d d 
Ik 2 ÉPÍ; — 1 — Plj1 2) — P(1] — Pld] 4 2(d— 1) c 2(d— 1). 
jz2 jz2 


Az előfeldolgozás tehát a minta hosszával arányos költséggel, vagyis lineáris idő- 
ben elvégezhető. 

Ezután a Knuth-Morris-Pratt-algoritmus általános lépését mutatjuk be. Te- 
gyük fel, hogy az m mintát éppen az s[i) betűvel kezdődően próbáljuk illeszteni, 
és már tudjuk, hogy s[i) — m(1], . . . , sli 4 j — 1] — ml[j], azaz a minta első j 
betűjénél illeszkedést találtunk. 


1. Ha j — d, akkor készen vagyunk, találtunk egy m-mel azonos részszót s-ben. 
Ha j c d, akkor (feltéve, hogy 1-4 j £ n) összehasonlítjuk az míj -- 1] és s[i 4 3] 
betűket. Ha ezek egyenlők, akkor j :— j 4-1, és a lépést befejeztük. Ha m[(j 41] A 
s[í 4 j], akkor két esetet különböztetünk meg: 
2. (a) Ha j — 0 (azaz éppen m első betűjénél tartunk), akkor m-et egy hellyel 
jobbra csúsztatjuk: i :— í 3- 1, és a lépést befejeztük. 

(b) Ha j 5 0, akkor az m mintát j — P[j) hellyel jobbra csúsztatjuk: é :— 
ij — Plj) és j :— Plj], és a lépést befejeztük. 





A lényeges ötlet a 2.(b) lépésben lapul. A P(j) érték mondja meg, hogy mi az a 
legkisebb esélyes mennyiség (nevezetesen j — P[j]), amivel érdemes eltolni jobbra 
az m mintát. Vegyük észre, hogy az eltolás után az m első P[j) betűje egyezik az s 
megfelelő betűivel. A fontos ebből, hogy az s szóban nem kell visszalépnünk. Az 
i-t j mennyiség ugyanaz a 2. (b) lépés előtt és után. 


Példa: Az s — cdebabababa szövegben keressük az m — bababc mintát. Tegyük 
fel, hogy m-et már az s negyedik betűjétől kezdve próbáljuk illeszteni, és éppen 
túl vagyunk az első öt betű hasonlításán. Mindez számokkal azt jelenti, hogy í — 4 
ésj —5: 


zal . Söt. ab : Si . Söt .ZBk . A : ZER . 59y dt. 
Ba Bá Ke 
idj 
A következő összehasonlításnál kiderül, hogy 5[9] £ ml[6], és ezzel a 2. (b) 


ágba kerülünk. Hasznát vesszük az eddigi sikeres összehasonlításoknak. Ezekből 
tudjuk, hogy s(4 : 8] — m(l : 5]. A következő esélyes illeszkedés helyét a P 
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tömbből tudhatjuk meg. Mivel P(5] — 3, a legkisebb esélyes eltolás az eddigi 
ismeretek alapján 2. A pusztán eggyel való eltotással nem érdemes próbálkozni; 
ha ott volna illeszkedés, akkor mÍl : 5) lábfejének a hossza 4 lenne. A 2. (b) lépés 
után ez lesz a helyzet: 


edebaba b aba 
b a b a-t 
i4j 


A lépés befejeztével i — 6 és j — 3. Az s szövegben nem kellett visszalép- 
nünk, a mintát pedig jobbra mozdítottuk. 


A módszer időigényének nagyságrendi becsléséhez itt is elég a betűösszeha- 
sonlítások számát vizsgálni. Ezt nagyban megkönnyíti az a tény, hogy az eljárás 
során az i és az í 4 j mennyiségek sohasem csökkennek. Kezdetben i — 1 és 
j - 0, teháti 4 j — 1. Egy lépés (ami legfeljebb egy betűösszehasonlítást jelent) 
megtétele után vagy i vagy pedig í -- j értéke nő. Miveli Snésitj£ na 
lépések és így a betűösszehasonlítások száma legfeljebb 2(n — 1). A módszer tehát 
összegészében — a prekondícionálás idejét ís beleértve — lineáris uniform költségű. 


10. 


Nyilvános kulcsú titkosírások 


A meglepetés kulcsa a gyorsaság ötvözése titoktartással. 
CARL VON CLAUSEWITZ 


Itt rövid ízelítőt adunk a kriptográfia, a titkos információcsere elemeiből. Az il- 
letéktelen hozzáféréssel szemben biztonságos kommunikáció sokáig elsősorban 
a politikusok és a katonák ügye volt. Ma, az elektronikus hálózatok világméretű 
térhódításával alapvető, mindennapi igénnyé vált a biztonságos és gyors informá- 
ciócsere. Ennek megfelelően a kriptográfia komoly tudományággá nőtt; se szeri, se 
száma a protokolloknak és algoritmusoknak. Utóbbiak egy része az algoritmusok 
bonyolultságának elméletén alapul, A kriptográfusok sajátos, fordított szemlélet- 
tel nézik a bonyolultsági eredményeket, amennyiben elsősorban a hatékonyan nem 
kezelhető problémák érdekesek számukra. Ami a gyors algoritmusok tervezésén 
fáradozók számára átok, az számukra áldás lehet. Több olyan kriptográfiai mód- 
szer ismeretes, amelynek a biztonságossága, , feltörhetetlensége" egy algoritmikus 
probléma nehézségén alapul. Bizonyos mértékig ilyen módszer a gyakorlatban is 
igen népszerű RSA-algoritmus, amit vázolni fogunk, érdekes alkalmazását adva 
ezzel néhány eddig megismert fogalomnak és eredménynek. 


10.1. Kriptográfia - a titkosírások tudománya 


Először szólunk néhány szót a kriptográfiáról általában. A titkos információcsere 
következő egyszerű és általános modelljét fogjuk használni. 
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I) 9.) 
nyílt szöveg étüdéses nyilt szöveg 
GE küddölő dekődotó 
z szék Hzki) ax 
(kütes kules 
ha ke 


9(f(z.ki).ko) za 


Az x a kódolatlan - szokásos szakkifejezéssel: irvílt — üzenet, amit el szeret- 
nénk juttatni a vevői Köztünk és a vevő közölt képzeljük el a csarornát, amin 
az üzenetnek át kell jutnia. A csatorna a kommunikációs rendszernek az a része, 
ahol az üzenethez illetéktelenek hozzáférhetnek. Ez ellen úgy védekezünk, hogy 
a csatornán az z üzenet kódolt változatát küldjük át, amit a másik oldalon a vevő 
megfejt, visszakapva az eredeti nyílt üzenetet. A kódolást, a titkosítást egy f eljá- 
rással (függvénnyel) végezzük. Az f egy ki kulcs segítségével végzi az átalakítást. 
Az f függvénynek a kódolandó szöveg és a ka inform paraméterei, Az ered- 
ményül kapott rejtjelezett f(x, ki) üzenet megy át a csatornán, A vevő oldalán a 
titkos üzenet megfejtését, a dekódolást szintén egy kulccsal (jelölje ezt k2) vezérelt 
g eljárás végzi. A g az y rejtjelezett üzenetből visszaadja a g(y, ke) nyílt szöveget. 
Az egymásnak megfelelő f, g eljárásokkal és ki, k2 kulcspárral szemben nyilván- 
való követelmény, hogy g(f(r, ki), k2) — ax teljesüljön minden z üzenetre. Jó- 
va) kevésbé formalizálható az a követelmény, hogy a rendszer biztonságos legyen. 
vagyis pusztán a csatornán átmenő kódolt f(x, ka) üzenetből ne lehessen kitalálni 
az x nyílt üzenetet. 














A Vernam-kódoló 

A teljes z nyílt üzenet és a Az — k2 — d kulcsok egyforma hosszú bitsorozatok, és 
f(z.d):- z 8d. Itt 6 a bitenkénti kizáró vagy (XOR) műveletet jelenti, d pedig 
egy véletlen" bitsorozat. Nyilvánvaló. hogy g — f használható dekódoló függ- 
vényként, hiszen egyfelől d 6 d sorozat csupa nullából áll, másfelől az B művelet 
asszociatív. A Vernam-kódoló egy régi, sokat használt eljárás. Hátránya, hogy a 
meglehetősen terjedelmes d kulcsot a kommunikáció megkezdése előtt valahogy 
(pl. futárral) biztonságosan el kell juttatni a másik félhez. 











A továbbiakban olyan rendszerekkel foglalkozunk, melyekben az f kódoló 
függvény az üzenet rögzített (mondjuk k) h. ágú darabjait kódolja el, és a 
titkos üzenet ezen elkódolt darabok egymásutánja. Hasonlóképpen működik a g 
dekódoló. 





A DES rendszer 
Röviden vázoijuk az IBM által kifejtesztett. alkalmas paraméterekkel az USA-ban 
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szabványosított DES (Data Encryption Standard) rendszer elemeit. Egyik kódoló- 
dekódoló alapeszköz a P-doboz. Egy P-doboz az 1z2 : - - 4 input bitsorozatot 
egy rögzített a permutációval az Tai) To(2) """ To) bitsorozattá alakítja. 

A másik alapeszköz az S-doboz. Egy S-doboz kulccsal vezérelhető. A kulcs 
egy beállítása mellett a doboz egy s : (0,13" — (0,1)" kölcsönösen egyértelmű 
(azaz invertálható) leképezést valósít meg. A következő ábra egy 4 bites (k — 4) 
P-dobozt és egy 3 bites (k — 3) 5-dobozt mutat. 


























josz Fo 000. 100 
—aJ001 ot [— 
0 — me 0 
0 —i meg 
es szg LIL 010 
P doboz S dahoz 


A P-doboz itt ciklikusan balra lépteti az input biteket; az 5-doboznál pedig a 
benne lakozó s függvényt igyekeztünk szemléltetni. Tehát például s(000) — 100, 
5(001) — 011. 

A DES ajánlás 64 bites nyílt üzenetek 64 bites rejtjelezett üzenetté való kódo- 
lását javasolja. E célra 64 bites P-dobozokat és 4 vagy 8 bites §-dobozok 16 il- 
letve 8 magasságú tornyait használja. Ilyen kódoló egységeket kell sorban egymás 
után fűzni. Jelölje Pi, . . . Pn a használt P-dobozokat, S], . . . Sn az 5-dobozok 
tornyait. A 64 bites xz üzenetből a szintén 64 bites Sm(Pm(. - - S1(Pu(z) . . .) rejt- 
jelezett üzenetet kapjuk. 





















































Az IBM Lucifer elnevezésű titkosítási rendszere hasonló elrendezésben 128 
bites P-dobozokat és 4 bites S5-dobozok (32 magasságú) tornyait használja. 
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10.2. Nyilvános kulcsú kriptográfia 


A régi vágású kriptográfiai rendszerek komoly gondja a kulcsok kezelése. A 
Vernam-kódoló jól mutatja ezt. A rendszer használata előtt az adónak és vevőnek 
meg kell egyeznie a használt d sorozatokat illetően. Az ehhez szükséges informá- 
ciócserének is biztonságosnak kellene lennie, hiszen ha valaki megneszeli a d so. 
rozatokat, akkor könnyen meg tudja fejteni az z éb d alakú üzeneteket. A nyilvános 
kulcsú rendszerek elegáns megoldást adnak a kulcsok kezefésére. Működésükhöz, 
mint látni fogjuk, nincs szükség előzetes titkos információcserére. 

Legyenek a kommunikációs hálózat résztvevői Aj, . . . , An. A; -nek egy titkos 
D; és egy nyilvános E; kulcsa van. Az E; kulcs mindenki számára ismert, mondjuk 
benne van a telefonkönyvben, Szintén nyilvános (és minden résztvevő számára 
ugyanaz) az f kódoló függvény, melyre minden í index és x input szó (üzenet) 
esetén teljesül, hogy 





TI(2 Ep), Do) — f(f(z.D) E) z 





E kikötések azt fogalmazzák meg, hogy f használható dekódoló függvényként is; 
ezenfelül (E;, D;) és ( D;, E;) összetartozó kulcspárok abban az értelemben, hogy 
ha az egyik kulcsot használjuk kódolásra, akkor a másik használható dekódolásra. 
Teljesülnie kell még két fontos további követelménynek: 








Ki: Adott a, E; bemenetre f(x, E;) hatékonyan számítható; adott x, D; beme- 
netre fiz, D;) hatékonyan számítható, 
K2: Pusztán x és E; ismeretében f(x, D;) nem számítható hatékonyan; ugyanígy, 


ha csak x és D; ismert, akkor f(x, Es) nem számítható ki hatékonyan. 





A Ki feltétel azt jelenti, hogy a kódolás, illetve dekódolás gyorsan végez- 
hető. Ez a feltétel viszonylag egyszerűen teljesíthető. Jóva! több gond van a Kz 
feltétellet, ami azt célozza, hogy a rendszer biztonságos, nehezen feltörhető titkos 
kommunikációt tegyen lehetővé. A K? tulajdonságot az ismert rendszerek úgy 
igyekeznek elérni, hogy adott x, E; esetén f(x, Di) meghatározása egy nehéz (pl. 
ismereteink szerint polinom időben nem kezelhető) algoritmikus probléma megol- 
lását jelentse. Ugyanez vonatkozik természetesen az z, D; párokra és az f(z, E) 
értékekre is. 

Tegyük fel, hogy van egy ilyen f függvényünk, A; rendelkezik a D; títkos 
kulccsal, és a telefonkönyvben megtalálhatók az E; nyilvános kulcsok. Nézzük, 
miként oldható meg két kommunikációs alapfeladat ebben a keretben. 








1. Ai titkos üzenetet küld A2-nek. Ai az x nyílt szövegből az Az nyilvános 
kulcsával az y — f(x, Fo) rejtjelezett üzenetet képezi, és ezt küldi el a csatornán. 
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A2 ezt a saját titkos kulcsával dekódolhatja: x — f(y, Do). A K? feltétel biztosítja, 
hogy az Az-n kívül más ezt az y üzenetet nem tudja megfejteni. 

2. A. aláírt titkos levetet küld A2-nek. Ekkor Ai az y — f(f(z, Di), E2) üze- 
netet küldi el. Más szóval A1 először kódolja x-et a Di titkos kulcsával, majd 
ennek az eredményét az Az nyilvános kulcsával. A fogadó oldalon Az így veheti 
le a két lakatot: z — f(fíy, Do), E1). Az első lépésben a bírtokában levő D2 
kulccsal visszakapja az f(x, Di) szót, ami aztán az E; nyilvános kulccsal kezel- 
hető. Az aláírást az jelenti, hogy a K2 feltevés szerint a második lépésben csak az 
E) kulcs fogja nyílt szöveggé alakítani f(y, Do)-t. 


10.3. A Rivest-Shamir-Adleman- (RSA -) kód 


Az előbb körvonalazott nyilvános kulcsú kriptográfiai séma egy nevezetes megva- 
lósítását szeretnénk bemutatni . Mielőtt nekivágnánk, kis kitérőt teszünk. Szüksé- 
günk lesz az euklideszi algoritmus egyik változatára, amivel egészek legnagyobb 
közös osztóját lehet gyorsan meghatározni. 

Legyenek ag 2 az legfeljebb k bit hosszúságú természetes számok. Képezzük 
az a; egészeket maradékos osztással a következők szerint: 


ag — gidi-ta2, 

ai — €242-baz, 
€n-2 — §n-1€n-i tFn 
€n-1 — €nün-Künt 


úgy, hogy lazyi] £ la:/2] teljesüljön mindeni 5 0 indexre. A sorozatot addig 
képezzük, amíg nullát nem kapunk; vagyis anyi — 0. Ez szükségképpen bekö- 
vetkezik, mégpedig gyorsan. Ha a két kezdő számunk legfeljebb k bit hosszúságú, 
akkor n £ k, hiszen minden lépésben — kivéve ésetleg az utolsót — legalább egy 
bittel rövidebb egészet kapunk. Az a;4i az a; és a;-1 számokból maradékos osz- 
tással kapható; a a; vagy la:-1/az] lesz, vagy pedig [5-1 /a;]. Ezek közül vala- 
melyikkel biztosan teljesül az la:41] £ la; /2] egyenlőtlenség. 

A sorozat végétől az eleje felé lépdelve látható, hogy lan] osztója mindegyik 
a;-nek, így a1-nek és ag-nak ís. Ha pedig a b pozitív egész osztója ag-nak és az -nek 
is, akkor a sorozat elejétől indulva kapjuk, hogy b osztója mindegyik a;-nek, ezért 
lanl-nek is. Vagyis lan] éppen ag és az legnagyobb közös osztója. A legnagyobb 
közös osztó tehát polinom időben kiszámítható. 

Feladat: Mutassuk meg, hogy polinom időben kaphatunk olyan cg és cz egésze- 
ket, melyekre cgag -b cia1 — Inko(ag, a1). továbbá Icol S ai és ei! £ ag. Ezek 
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alapján elmondhatjuk, hogy ag és a1 legnagyobb közös osztója hatékonyan kife- 
jezhető a két szám egész együtthatós lineáris kombinációjaként, mégpedig nem túl 
nagy együtthatókkal. (Az euklideszi sorozat elejéről indulva sorra fejezzük ki az 
a; számokat ag és az segítségével.) 


Megjegyezzük még, hogy a legkisebb nemnegatív maradékokat használó euk- 
lideszi sorozat (az lass! S la:/2] követelmény helyett 0 £ asy1 £ a; szerepel) is 
elég gyorsan eléri a nullát; ennek az igazolása azonban valamivel bonyolultabb. 

Ezután ismertetjük a Rivest-Shamir—-Adleman- (széles körben használt rö- 
vidítéssel RSA-) kriptorendszert. Ahogy korábban megállapodtunk, legyenek 
Ai... An a kommunikációs hálózat résztvevői. Először A; generál két nagy 
prímszámot, p;-t és g-t (mondjuk 500 bináris jegyűeket). Ez a 9.4.3. pontban látot- 
tak szerint hatékonyan megtehető véletlen választásokkal és prímteszteléssel. Le- 
gyen m; — pig. Ezen felül A; választ egy véletlen e; természetes számot, melyre 
1 a e; € mi és Inkote;, ól(m;)) — 1. Kt é az Euler-függvényt jelenti. Tudjuk, 
hogy élm;) — (pi; — 1)(ai — 1). Végül kiszámít egy olyan 0 — d; a m; egészet, 
melyre ezd; z 1 (mod (p;— 1)(a; —1)). Az e; ellenőrzése, majd pedig d; számí- 
tása az euklideszi algoritmussal történhet. Az utóbbihoz olyan cg és cs egészeket 
keresünk, melyekre cge; - ciélmi) — 1, leol c $(m;) és leir] £ ez (lásd az euk- 
lideszi algoritmussal kapcsolatos feladatot). A d; :— cg (mod $(m;)) választás 
nyilvánvalóan jó lesz. 

Az A; titkos kulcsa a D; — (d;, mi), nyilvános kulcsa pedig az E; — (e;, mi) 
pár. Az E; kulcsot közzéteszi, a D;-t, pontosabban d;-t pedig megtartja magának. 

Feltesszük, hogy a nyílt üzenet olyan x egészek sorozata, melyekre 
0£ x a m; és Inkolz, mi) — 1 teljesül. Az első feltétel pusztán azt jelenti, hogy 
az üzenetet blokkonként akarjuk kezelni. A második feltétel nem támaszt komoly 
megszorítást; m;-hez képest elenyésző azoknak a (0, m;) intervallumba eső z egé- 
szeknek a száma, amelyek oszthatók p;-vel vagy gi-vel. 

Az f kódoló/dekódoló függvénynek három argumentuma van. Ezekből az 
utolsó kettő együtt alkotja a kulcsot. Az f a nyílt szöveg egy z blokkját alakítja át 
rejtjelezett blokká: 

f(z,e;ma):—z" (mod m;). 
Így néz ki az z-nek az A; nyilvános kulcsával kódolt változata, Feltesszük, hogy 
az eredmény a legkisebb nemnegatív maradék: 0 £ f(z,es,m;) c mi. Ahogy 
korábban utaltunk rá, ugyanezzel a függvénnyel végezzük a dekódolást is. A; az 
általa kapott titkos üzenet y blokkját (0 £ y a m;) az alábbi módon fejtheti meg: 


f(y.di. mi) :— yi (mod m;). 


Nézzük ezután az előző pontban megfogalmazott követelményeket! Tudjuk, 
hogy ezd; — 1 4 é(mi)g teljesül alkalmas g egészre. Ezt, és a számelméletből jól 
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ismert Euler-Fermat-tételt használva 
J(f(z, ess ma), ds, ma) — (ze) zaöti zzz . (Pm) )t s 2.19 z z (mod m;), 


vagyis a rejtjelezés után a dekódolás tényleg visszaadja az eredeti üzenetet. 
A szorzás kommutativitásából közvetlenül adódik az E;, D; kulcsok felcserél- 
hetőségét jelentő 


J(f(z, ei, ma), di, ma) — f(f(z, di, mi), ez, mi) — 


azonosság. Ami a Ki feltételt illeti, f hatékonyan számítható gyors hatványo- 
zással. A K? feltételt az , biztosítja", hogy az e-edik gyökvonásra mod m; nem 
ismert polinom idejű módszer (randomizált sem), ha m; összetett, és nem tudjuk a 
prímosztóit. 





Feladat: Mutassuk meg, hogy p;, gi; és e; ismeretében d; hatékonyan meghatá- 
rozható. Tehát az m; felbontását ismerők A; titkos kulcsát könnyen kideríthetik. 


Megjegyzés: Az RSA biztonságosságát illetően elmondhatjuk, hogy a rendszer 
eddig ellenállt a feltörési kísérleteknek, és szép, sikeres gyakorlati alkalmazásai 
vannak, Ugyanakkor nincs bizonyítva, hogy a feltörése algoritmikusan nehéz fel- 
adat lenne. Nem tudjuk egyfelől, hogy az egészek felbontása (m; ismeretében pi; 
és g; meghatározása) nehéz-e. Másfelől az sincs bizonyítva, hogy az RSA elleni 
sikeres támadáshoz tényleg kell tudni egészeket felbontani; pusztán arról van szó, 
hogy más esélyes támadási irányról nincs tudomásunk. 

Vannak olyan, az RSA-nál bonyolultabb rendszerek, amelyek feltörése bizo- 
nyítottan legalább olyan nehéz, mint az egészek prímtényezős felbontásának a fel- 
adata, 


Példa: Szeretnénk itt szemléltetni az RSA -rendszer működését. Az olvasó kényel- 
méért eltekintünk a többszáz bites prímek használatától; beérjük öt bittel is. To- 
vábbi egyszerűsítésként elhagyjuk az i indexet ( A; helyett A-t, p; helyett p-t írunk, 
stb.) 

Legyen p — Il és g — 17. Ekkor az m modulus értéke 11 : 17 — 187. A $(m) 
értéke 10 - 16 — 160. Legyen az e nyilvános kulcs 9, és határozzuk meg a d titkos 
kulcsot. E célból az euklideszi algoritmust hívjuk segítségül. Az ag — 160, az — 9 
bemenettel a számítás így alakul: 


160—18.-9—-2, 
9—-(—4)-(—2 41 
—2 5 (—2):1-40. 


Innen látjuk egyrészt, hogy Inko(éím), e) — inko(160, 9) — 1 tényleg igaz. Más- 
részt az első egyenlőségből —2-t kifejezve és a másodikba helyettesítve 9 — (—4)- 
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(160 — 189) 4- 1 adódik, amiből átrendezéssel kapjuk, hogy —71-9-H4.160 — 1. 
A titkos kulcs tehátd — 89-—71 (mod 160). 

Egy az A-nak szánt r üzenetblokk kódja az f(r,9,187) :— 2" (mod 187) 
szó lesz. Például az x — 3 üzenetnek 39 — 31.31.3 — 81.-81.3 5 16.3— 
48 (mod 187) lesz a kódja. Az y rejtjelezett blokk dekódolása, visszafejtése az 
f(y,89,187) :— y$? (mod 187) függvénnyel történik. 
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64, 69, 70 
a kielégíthetőség 
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3-DH — 3 dimenziós házasítás 
3 dimenziós házasítás (3-DH) 282 
285, 295 
3 ház — 3 kút a gráf 
3-SAT a kielégíthetőség 
3-SZÍN a színezhetőség 
80-20 szabály a eloszlás 
A 
abc-sorrend 26, 83 
adatszerkezet 37 
adattömörítés 102 


16, 113, 116, 
123, 125, 157, 262 
algoritmus 9, 13, 18, 191, 203, 247 

hindu—arab- 21 

rendezési a rendezés 
alsó becslés I9, 33, 37, 44, 47 
alsó korlát (hálózatban) 186 
általánosított Riemann-sejtés 320 
alternáló 


adjacencia-mátrix 


erdő a erdő 

út a út 
álvéletlen 315 
próbálás bh) 

apa (fában) 38 
apró paraméter 304 
aranymetszés 56 
artikulációs pont 145 
asszociatív szabály 76 
átlagos költség 27, 32, 63, 86, 89, 
91, 94, 98, 99 

Avizienis algoritmusa 23 
AVL-fa 4.4 Azé gáa 


B 

Batcher módszere  — összefésülés 

befejezési szám 130, 733, 138, 143, 
144 


beillesztés a beszúrás 


337 
bejárás a fa, gráf 
bejáró algoritmus a gráf. fa 

bejárása 
Bellman-Ford-módszer — 120, 123, 
139, 302 

belső 
csúcs 38, 64, 65, 69 
memória 5], 70, 90, 95, 110 
pont módszer 294 


beszúrás 31, 37, 40, 42, 57, 66, 70, 
73, 80, 83, 85, 86, 91, 98, 


159 
naiv 61, 63, 73 
beszúrásos rendezés a rendezés 
B-fa 69 
bináris 
fa a fa 
keresés a keresés 
keresőfa — keresőfa 
binomiális együtthatók 302 
binsort a rendezés (láda-) 
blokkoló folyam a folvam 
Boole 
-formula 272 
kielégíthető 
— kielégíthetőség 
-mátrix 125 
Borel-Cantelli-lemma 238 
Borűvka módszere 155, 166 
branch-and-bound  — elágazás és 
korlátozás 
breadth-first-search (BFS)  — gráf 
bejárása 


buborék-rendezés -— rendezés 


c 

Cantor-féle átlós módszer 204, 208, 
253 

Carmichael-szám — — pszeudoprím 

Church tétele 217 
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Church-Turing-tézis 203. 229, 239. 

242 
CNE — konjunktív normálformájú 
coNP 257, 261, 263-265, 267. 270, 


271, 316 
Cook-Levin-tétel pr j 
coRP 315 
ces 
csomósodás 95 
elsődleges 93 
másodlagos 93 
csoport 265 
csúcs 75, I 
kritikus 141 
súlya 56, 78 
csúcsösszevonás 67 
csúcsvágás 67 
D 
DAG a gráf 
dekódolás 102. 108, 329 
depth-first-search (DFS) - gráf 
bejárása 
DES (Data Eneryption Standard) 
329 
determináns Er MÉti 
d-fa a fa 
diagonális nyelv 208. 209 


Dijkstra módszere — 116, 179, 122, 
124, 139, 140, 150, 157. 
160, 298 

dinamikus 
halmaz 98 
Huffman-kód 6 Huffinan-kód 
programozás 123, 299, 302, 
324 
Dinic módszere 779, 181, 184. 189, 
254. 265 
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diofantikus 
egyenlet 218, 228 
halmaz 219 
d-kupac a kupac 
Dominóprobléma 222 
dupla forgatás — forgatás 
E 
Edmonds-Karp-algoritmus 179. 
180 


egyenletes eloszlás 
ekvivalencia 


2 eloszlás 


-osztály 112, 142 
-reláció 112, 142 

él 1 
kritikus 141, 176, 180 
színezése -a piros-kék 
módszer 

telített a telített pontpár 
elágazás és korlátozás 299 


eldönthetetlen 791, 215, 276, 219, 
222, 226, 227, 234 


eldönthető 203 


élek osztályozása 131. 138, 144, 
148 

előreél 132. 748 
faél 131, 145, 148, 150 
keresztél 132. 7148, 150 
visszaél 132, 136, 138, 145, 

148 

elérési gyakoriság a keresési 
gyakoriság 

élidegen utak 183, 184 
Éllefogás feladat 282, 286 
éllefogó halmaz 185, 282 
ellenség-módszer 21.28 
ellipszoid-módszer 294 
éllísta 114, 119, 129, 143, 150. 


158, 161. 170, 254 
fordított 139 
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eloszlás 29 
80-20 szabály szerinti 101 
egyenletes 100, 312 
zZipt 100 

előreél 2 élek osztályozása 

elsődleges csomósodás 
a csomósodás 
elsőfokú csúcs 152 
élsúly 110, 112, 115. 135, 139, 
IST, 160, 166, 167 


egységnyi 128, 149, 289 
kis egész 165 
negatív 120, 122 
nemnegatív TS, 120, 124, 
139, 140 
pozitív egész 289 
elvágó pont a artikulációs pont 
erdő 112. 131, 154 
alternáló 169 
feszítő a feszítő erdő 
erőforrás-kiosztás 167 
erősen összefüggő 
gráf 141. 145 
komponens Tal 
euklideszi algoritmus 332 
Euler 
-állandó 44, 100 
-bejárás 308 
-Fermat-tétel 334 
-függvény 333 
explicit halmaz 221 
exponenciális idő 252, 271, 301 
EXPTIME 252, 271 
F 
fa 38, 58, 112, 120, 148, 151. 163, 
256, 277 
2-3- — 2-3-fa 
AVL- — AVL-fa 


B- -a B-fa 
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bejárása EOSSEZE Ea 
inorder 59. 79 
Lindström- 309 
mélységi 431 
postorder 59. 731, 321 
preorder 59, 731. 321 
bináris 38, 58, 78, 103 
teljes 38, 59 
feszítő- a feszítőfea 
kiegyensúlyozott Z 77.70 


magassága (szintszáma) 59 
61, 63-68, 70-72, 77, 78 





§- -a §-fa 
teljes d-fa 41 
faél a élek osztályozása 
felszivárog a kupac 
Fermat 
-tanú 317 
-teszt 316 
tétele 94, 316 
feszítő erdő 
mélységi 131. 145 
szélességi 148 
feszítőfa 111, 146 
mélységi 132, 145 
minimális költségű 151. 756, 
160, 254 
külcsmanipulációs 
módszerrel 166 
más költségfogalommmal . /óó 
összehasonlítással 166 
szélességi 149 
Fibonacci 
-hash-elés — hash-elés 
-szám 55, 72 
FIFO-lista a sor adatsz. 
first ft 
decreasing 


fiú (fában) 


340 
Floyd módszere 122. 125-127, 
302, 304 
FOGYASZT — kupac 
fok 12 
folyam TITI, 150, V71, 172. 188, 
264 
biokkoló 181 
értéke 172 


maximális 473, 175, 179, 180, 
182, 184-186, 254, 265 
nulla- 173, 176, 179, 181, 186 


vágáson áthaladó 174, 185 
Ford-Fulkerson 
-algoritmus 178, 179 
-tétel — /74, 177, 184, I85, 264 
forgatás 73, 76, 81, 82 
dupla 72 
forrás 115, 171, 172 
FP 246, 249, 254, 267, 268, 290, 
295 
futam 52 
független 
élhalmaz 305 
pontrendszer 280, 282 
maximális (MAXFTLEN) 
280, 282, 300 
függvény kiszámítása 213 
G 
Gauss-elimínáció 311 


gráf 14.15, 110, 111. 254, 255, 
262, 263, 278, 280, 285 


3 ház — 3 kút 263 
ábrázolása 13 
bejárása 1 


mélységi 777, 127. 128, 136, 
138. 143, 144. I45, 147 


szélességi III, 128. 146, 
149, 170, 180 
centruma 126 


TÁRGYMUTATÓ 


irányítatlan 78, 770, 111. 120, 

144, 145. 148, 151. 262, 

269, 286. 289 

irányított 78, 110111, 175, 

135, 141, 144, 147. 172. 

183, 188. 263. 269, 286 

végtelen 224 
irányított körmentes (DAG) 

135. 740, 181, 288, 296 

topologikus rendezése 736, 

137, 141, 144, 152, 296 

páros — 16, 167, /69. 184, 282, 


313 
ritka 115, 779, 158 
súlyozott a élsúly 
sűrű 119, 160 
teljes 5-ös 263 
GY 
gyors hatványozás 265, 3717, 334 
gyorsítási tétel 198 
gyorsrendezés a rendezés 


gyökér 38. 58, 59, 64, 67-69, 81, 
84, 103, 146, 148. 163, 224 


H 

hálózat 172 
alsó korlátokkal 186, 188 

hálózati folyam a folyam 


Hamilton-kör 740, 255, 262, 264, 


269, 285, 289, 308 


irányított 263, 269, 285 
minimális költségű  — Utazó 
ügynök 

harmonikus szám 44, 100 
hash-elés 86, 98 
Fibonacci- 97 
kettős 95, 96, 97 
nyított címzés 87, 99, 95 


vödrös 87. 88. 95 
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hash-függvény 87, 90, 95, 97 
megfelelő 87.95 
hash-kódolás a hash-elés 
Hátizsák feladat 289, 303 
apró értékkorláttal 304 
apró súlykorláttal 304 
HB-fa 77 
Hilbert 10. problémája 191, 217 


hindu-arab-algoritmus 
— algoritmus 


hóeke modell 54 
Horner-elrendezés 322 
Huffman 
-fa 103 
-kód 102 
dinamikus 105 
hurokél 113, 132, 133 
I 
időigény 197, 247 
index-szint 70 
inorder -3 fa bejárása 
fonal 6l 
input (bemenet) 13 
hossza 3 szó hossza 
szalag 193 


interpolációs keresés 3 keresés 
intervallumiistázás (TÓLIG) BAK 

61, 68, 70, 98 
invariancia-tétel 230, 316 
inverz Ackermann-függvény 165 


irányítatlan gráf 3 gráf 
irányított 
gráf 3 gráf 
kör o kör 
körmentes a gráf 
út a út 
írógép-paradoxon 229 
irracionális szám 97 
irreflexív reláció 25 
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iteráció 37 
izolált csúcs 103 
J 
javító gráf 175, 180 
javító út — út 
Johnson módszere 159 
jól karakterizált nyelv 263, 316 
K 
kanonikus felsorolás 204, 274, 219, 
233 
kapacitás 171, 172 
egész 178, 254, 264 
irracionális 179 
kritikus 176 
vágásé 3 vágás 


karakterisztikus függvény 215 
Karp-redukció 268, 272, 276-278, 
281-283, 285, 286, 


289-292, 295 
kék "a piros-kék módszer 
kékes él a piros-kék módszer 
kék fa 3 piros-kék módszer 
keresés 27.57, 61, 65, 70, 80, 85, 

86, 89, 98 

k-adik elemé 44 

bináris 28, 32, 267, 290, 297 

interpolációs Pa 

lineáris 27.31 

sikeres/sikertelen 97.94, 95. 

99 

szekvenciális 87. 89, 99 
keresési 

feladat 266 

gyakoriság 80, 100 

keresőfa 57, 83, 86, 98, 297 

átlagos költsége 63 


bináris 60, 63, 71, 77, 78, 80 
-tulajdonság 60 


342 
keresztél 3 élek osztályozása 
kétrészes gráf a gráf (páros) 
kettős hash-elés — hash-elés 
kezdőszelet 84. 103, 324 
kiegyensúlyozott 
ábrázolás 22 
fa a fa 
kielégíthetőség (SAT) 272. 295 
k-SAT 277 
3-SAT 276, 277, 278, 283 
2-SAT SZT 
kifejezésfa 76, 277 
KIFORDÍT művelet — S-fa 
kifordított fa a S-fa 
kínai maradéktétel 318 
Kirchoff törvénye 171, 172 
kis Fermat-tétel a Fermat tétele 
kiszámíthatatlan 205, 208, 233 
kiszámítható 190, 791, 202, 203, 
208, 210 
klasztereződés a csomósodás 
klikk a teljes részgráf 
Knuth-Morris-Pratt-algoritmus 
324 
kódolás 102, 106, 329 
kódolt (rejtjelezett) üzenet 329 
Kolmogorov 
-bonyolultság 791, 229, 237, 
234, 236, 316 
"véletlen sorozat 237 
kombinatorikus optimalizálás 7, 
171 
komplementer 
gráf 282 
nyelv 231, 252, 263-265 
nyelvosztály 211 252 
komponens a összefüggő 
komponens 


kongruens szám 227 
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konjunktív normálformájú 


Boole-formula 276 
k-CNF 276 
3-CNF 277 
2-CNF 277 
konzervatív rendezés — — rendezés 
(stabil) 
korlátozó heurisztikák 300 
König 
-akadály 17. 186, 264 
-lemma 224, 226 
minimax tétele 184, 264, 252 
kör 112, 153, 161, 162, 262 
egyszerű TIZ 4AL 182 
irányítatlan 132 
irányított 135, 263 
negatív összsúlyú 775, 721, 
122 
legrövidebb 150 
körmentes 772. 132, 135, 151, 162 
közelítő módszer 299, 305 


közvetlen elérésű gép (RAM) 791, 


239, 253, 255 

kriptográfia 328 
kritikus 

kapacitás a kapacitás 

kromatikus szám 16 

Kruskal módszere 1755, 160. 162, 


164-I66, 254, 298, 308 
kulcs 26, 29, 37, 46, 57. 58, 64, 69, 
84, 86, 88, 90, 95, 329 


nyilvános J9E 333 

összetett 48 

títkos A31. 348 
kultcsmanipuláció 

élsúlyokkal a feszítőfa 

rendezésnél a rendezés 
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kupac 37, 41, 45, 54, 58, 59, 100, 
IT, 19, 158. 159, 161, 
254 


d-kupac 41, 119, 159, 160 
BESZÚR eljárás — beszúrás 
-építés 39, 42 
felszivárog eljárás 39, 42 
FOGYASZT eljárás 41, 42, 
119, 160 

MINTÖR eljárás 
— minimumtörlés 
-tulajdonság 38, 41 
kupacos rendezés 3 rendezés 
Kuratowski tétele 263 
különleges út a út 
külső tár A, AZ 
kvadratikus idő 254 
kvadratikus maradék próba 93, 96 

L 

lábfej 324 
Ládapakolás 291, 295, 306 
ládarendezés 3 rendezés 
Lagrange tétele 220 
láncolás 3 hash-elés (vödrös) 
lapelérés 52, 69, 70, 89 
lap (külső táron) 52, 69, 88 
lapösszevonás 70 
lapvágás 70 
Las Vegas 315, 320 
-teszt 315 
lefogó élek 184 
lefogó ponthalmaz a éllefogó 
halmaz 
leghosszabb út a út 


legkisebb elem  — minimumkeresés 
legnagyobb elem 

a maximumkeresés 

legnagyobb közös osztó (Inko) 377. 

332 


343 
legrövidebb út a út 
Lempel-Ziv-Welch-módszer 88, 

106 
leszármazott (fában) t32 at 


levél 38, 59, 64, 65, 69, 84, 103 
lexikografikus rendezés 

— rendezés 

Lindström-bejárás . — fa bejárása 

lineáris 

idő 21, 40, 45, 47, 49, 60, 119, 

129, 139, 143, 149, 160, 

165, 166, 248, 253, 254 


keresés 3 keresés 
próbálás 91, 95, 96 
ptogramozás 292 
egész értékű 294 
lista adatszerkezet AA 
literál 272, 276, 279, 283 
logaritmikus 
költség 241, 253, 255, 262 
tár 249 
logikai cím 88 
Lucifer rendszer 330 
M 
magyar módszer 168, 184, 254 
maradékos osztás 96 
maradékosztály 94, 265 


másodlagos csomósodás 
"3 csomósodás 


Matjjaszevics tétele 220 
mátrix 113 
MAXFTLEN a független 
pontrendszer 

maximális 
folyam a folyam 
független — független 
párosítás a párosítás 


— teljes 
részgráf 


teljes részgráf 


344 
maximumkeresés 44, 57, 61, 70, 
98, 127 
MAXKLIKK a teljes részgráf 
Megállási probléma 791, 216, 217, 
220, 234 
mélységi 
bejárás (keresés) a gráf 
bejárása 
szám 130, 133, 144, 146 
Menger tétele 184, 264 
minimális 
késésszámú ütemezés 
3 ütemezés 
költségű feszítőfa — — feszítőfa 
vágás a vágás 
minimax tétel 173 
Ford-Fulkerson- 174, 175, 
177, 184, 185, 264 
König- 184, 264, 282 
Menger- 184, 264 


minimumkeresés 44, 57, 61, 70, 79, 
98, 118, II9, 127, 159, 161 
minimumtörlés 37, 40, 41, 42, 45, 
54, 1I9, 159, 161 


mintaillesztés 323 
modeli 12, 14 
módosítás 57, 86, 89 
moduláris 
hatványozás 266 
összeadás 90 
mohó elemzés 107 
mohó módszer 771, 116, 128, 156, 
160, 298 
multiplikatív inverz 94 
munkaszalag 197 


mutató (pointer) 58, 59, 61, 64, 69, 
82. 84, 88, 110, 114, 138, 

160, 163, 165, 239, 243, 

255, 321 
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N 

nemdeterminisztikus 
felismerés 258 
Turing-gép —3 Turing-gép 
növelés a Dinic módszere 
növelő út a út 
NP 246, 257, 258. 261, 262, 265, 
267. 269, 271, 272, 295, 
314, 316 
NP-nehéz 276, 298 
NP-teljes . 246, 271, 272, 275, 277, 
278, 281-283, 285, 286, 
289-292, 295, 300, 301, 


303, 308 
NTG a Turing-gép 
(nemdeterminisztikus) 
nulla-folyam a folyam 
NY 

nyelő 171, 172 
nyelv 193 
felismerése 194, 271, 213, 267 
-osztály 211 
nyílt üzenet 329 
nyilvános kulcsú titkosírás 331 
nyitott címzés a hash-elés 
nyomulás a Dinic módszere 

o 
on-line algoritmus 166 
optimalitás elve 777, 122, 123, 302 
oszd meg és uralkodj 28, 35, 42, 
297 
osztómódszer 96 
output (eredmény) 13 
szalag 193 

Öö 
önszervező 80, 101, 164 
ős (fában) 146, 148, 321 
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összefésülés 35, 38 
páros-páratlan (Batcher) 50 
többfázisú (polifázisú) E: 4) 

összefésüléses rendezés 

3 rendezés 

összefüggő 
gráf 112. 132, 741, 145, 146, 
151, 152. 154, 160, 166 


komponens 112, 132, 142, 
145, 148, 166 

összefűzés (rendezett listáké) 79 
összehasonlítás 2938 
összenyomhatatlan 232, 237 
összenyomható 191, 229 
összetettségi teszt 316, 319 


Öösszetettszám 265, 316, 317, 319 


P 
P 246, 248, 254, 257, 261, 
264-267, 270, 271, 277, 
290, 314, 320 


palindróma (tükörszó) 235, 253 
parciálisan rekurzív függvény 203, 


213 

Parciális függvény 202 
párhuzamos algoritmus 22 
gráf bejárására 128 
min. feszítőfára 155 
összeadásra 21 
rendezésre/összefésülésre 26, 

50 

Páros gráf a gráf 
párosítás III, 150. 167 
maximális 167, 184, 254, 282, 
306 

párosított csúcs 167 
teljes 17. 313 


pPáros-páratlan összefésülés 
a összefésülés 


partíció 162. 167, 174 


345 
Partíció feladat 29], 292 
Pascal-háromszög 302 
patt 136 
PCP a Post megfeleltetési 
problémája 
P-doboz 330 
permutáció 33, 90, 93 
PERT 
-gráf 135, 140 
-módszer 140, 176 
pillanatnyi helyzet 250, 256, 273 
piros -a piros-kék módszer 
piros-kék módszer — 153, 7156, 166 
kék 
él 153. 156, 160 
erdő 166 
fa 154, 156, 160-162 
szabály 153, 156 
kékes él 157. 159 
piros 
él 153, 160 
szabály 153 
színezetlen él 133 
takaros színezés 153 
pitagoraszi számhármas 218 
pointer 3 mutató 


polifázisú összefésülés 
a összefésülés 


polinom 218311 
-azonosság tesztelése 311 
foka 218 


idő — 248, 249, 254, 255, 265, 
282. 294, 298, 301, 304, 
306, 313-316, 320, 321, 


331, 332. 334 

kiértékelése 322 

tár 252 
polinomiálisan összehasonlítható 

245 


346 


Pontos fedés hármasokkal (X3C) 
282, 285, 290 
Post megfeleltetési problémája 226 


postorder -4 fa bejárása 
Pratt tétele 265, 267 
prefix a kezdőszelet 

kód 103 
prekondícionálás 299, 321 
preorder -a fa bejárása 
primitív gyök 265 


Prim módszere 755, 156, 159, 160, 
166, 254, 298, 308 


prímszám 93, 96, 221, 265, 316, 
333 
keresése 320 
-tétel 320 
prímtényezős felbontás 266, 290 
prímteszt 316, 320 
prioritás 37 
prioritási sor 38 
próbasorozat 91, 93-95 
PSPACE 252, 261, 271 
pszeudoprím (Carmichael-szám) 
318 
R 
Rabin-Miller 
-tanú 320 
-teszt 318, 320 
radix rendezés 3 rendezés 
RAGASZT művelet 3 §5-fa 
RAM -a közvetlen elérésű gép 
randomizált . — véletlent használó 
redukált gráf 143 
rekurzió az 
rekurzív 
függvény 203. 213 
halmaz 219 
nyelv 202, 208, 210, 211, 213, 
253 


TÁRGYMUTATÓ 


rekurzíve felsorolható 


halmaz 219 
nyelv 202, 208, 210, 211. 213, 
214 
relatív prímek 95, 97 
rendezés 25, 98. 99 
Batcher- a összefésülés 
beszúrásos 31. 89, 99 
bináris kereséssel úr 
lineáris kereséssel at 
buborék- 30. 33, 44 
gyors- 42, 64, 298, 310 
kulcsmanipulációs 26, 46 
kupacos 38. 41 
külső tárakon 5 
láda- 47, 48, 83 
lexikografikus 26, 48, 83, 274, 
219, 254 
összefésüléses 35, 46, 50, 57, 
297 
külső tárakon 52 
összehasonlítás alapú 26, 29, 
33.35 
radix 48, 83, 165 
stabil (konzervatív) 31 
rendezési reláció izé 
rendezett 
halmaz 25 
lista 79, 161 
típus 25. 46. 47, 57 
részbenrendezés 296 
részfa 58, 70, 71. 77. 132, 145 
-lemma 134, 137. 138, 144 
részgráf 151 
részhalmaz 162 
Részhalmazösszeg probléma (RH) 
290, 291, 295 
ritka gráf a gráf 


robusztusság 253, 254, 261 
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RP 314, 319, 320 
-teszt AT te 
RSA-rendszer 328, 332 
S 
SAT — kielégíthetőség 
Schwartz-lemma 312 
§5-doboz 330 
§-fa 80, 101, 164 
síkba rajzolhatóság 263, 282 
síkgráf —a síkba rajzolhatóság 
Sor adatszerkezet 138, 147, 149 
splay tree a §-fa 
stabil rendezés a rendezés 
standard ábrázolás 22 
Stirling-formula 32 
súgásszalag 258 
súlyfüggvény a élsúly 
súlyra kiegyensúlyozott fa (SK-fa) 
77 
sűrű gráf a gráf 
sz 
számítási út 256, 259 
számtani sorozat 97 
szekvenciális 
elérés 52 
keresés a keresés 
szélességi 
bejárás (keresés) a gráf 
bejárása 
feszítő erdő a feszítő erdő 
számozás 148 
szimmetrikus differencia 168 
szimplex-módszer 293 
szimuláció 198, 242, 253. 259 
színezés 16, 262 
2 színnel 254, 280 
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3 színnel (3-SZÍN) 255, 262 

264, 278, 281, 282, 295, 

301 

éleké a piros-kék módszer 

színezetlenél — piros-kék módszer 

szintszám 3 fa magassága 

szó 83, 193 

hossza 85, 195, 197, 204, 214, 

229, 230, 232, 234, 235, 

241, 247, 253, 255, 256, 

259, 260, 262, 265, 266, 

268. 269, 273, 304, 314 

szófa 83, 106 

szomszéd 67.116, 1I9, 129, 147 
szomszédossági mátrix 

—3 adjacencia-mátrix 

szorzómódszer 96 

szótárszerű rendezés a rendezés 

(lexikografikus) 

szuperforrás 18 

születésnap-paradoxon 87 


T 
T. Sós Vera tétele 97 
takarítás a Dinic módszere 
tanú 259, 260-267, 270, 272, 273, 
277, 281, 283, 285, 290, 
295, 311, 315, 317 





tanú-tétel 259 
tár-idő-tétel 216, 250 
tárigény 197, 247 
távolság (gráfban) 115, 122, 149, 
180 
telített pontpár (él) 172, 180 
telítettségi tényező 91 
teljes 
fa a fa 
ötszög a gráf 
párosítás a párosítás 
rendezési reláció 25 
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részgráf 281 
maximális (MAXKLIKK) 

255, 281, 282, 296 

Termékszerkezet-feladat 292 

testvér (fában) 67 

TÓLIG — intervallumlistázás 

topologikus rendezés a gráf 
többfázisú összefésülés 

3 összefésülés 

törlés 57, 66, 67, 70, 76, 80, 86, 89, 


91, 92, 98 
naiv 61, 73 
TÖRÖLT jel 92 
törzstényezős felbontás 334 
tranzakció 135 
tranzitív 
lezárt 125 
reláció 25 
Turing-gép /90, 191, 247, 255, 316 
egyszalagos 199, 235, 253 
felismert nyelve 194 
időkorlátos 247 
kétszalagos 200, 253, 258 
kiszámított függvény 194 
kódja (leírása) 205, 206, 208 
nemdeterminisztikus (NTG) 
255 
számolási ideje 197..247 
tárigénye 197 
tárkorlátos 248 
univerzális 205, 208, 209, 216, 
229 
Turing tétele 210, 217 


Tutte tétele 313 


tükörszó a palindróma 
U 
unáris ábrázolás 304 


uniform költség 241, 280, 288 
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UNIÓ-HOLVAN adatszerkezet 


111, 162 
univerzális 

kereső feladatok 27 
nyelv 299, 210 
Turing-gép a Turing-gép 
univerzum 37, 46, 86 
út 80. 84, 103, 112, 115 
alternáló 168 
egyszerű 112. 121, 139, 151 
hossza 4115, 180 
irányított 112. 122, 134. 141, 
149, 176 
végtelen 224 
javító 168 
kritikus 141 
különleges 117 
leghosszabb 289 
DAG-ban 139, 288 
legrövidebb III, 115, 122, 
128, 149, 304 
DAG-ban ha 
nyomonkövetése 720, 122, 
125, 140 
növelő 176, 179, 180 
legrövidebb 179 
Utazó ügynök probléma 740, 255, 
285, 289 
euklideszi 308 
útösszenyomás 164 

Ü 
ütemezés 135. 188 
minimális késésszámú 296 
ütközés 87. 96 
feloldása 87, 90 

v 
vágás Y74, 185 
kapacitása 174, 185 
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minimális 175 
valós idejű 98 
várakozási gráf 155 
várható költség 43 
végszelet 324 
végtelen 

ciklus 2725, 192, 194, 209, 213, 

216, 250, 257 

út a út 

véletlen sorozat 3 Kolmogorov 

véletlent használó módszer 42, 

166, 298, 310, 314 

Vernam-kódoló 329 

visszaél - élek osztályozása 
von Mises-paradoxon 

-a születésnap-paradoxon 

vödör 88 

-katalógus 88, 95, 99 
vödrös hash-elés a hash-elés 
w 
"Warshall algoritmusa 126 
VA 
zár 136 


Zipf eloszlás a eloszlás 
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